Joy Shin
느린 LLM을 위한 해법, Speculative Decoding