티스토리 뷰
반응형
RAG 어플리케이션을 개발하면서 LLM에서 생성하는 텍스트를 스트리밍으로 한글자씩 나오도록 구현해보았다.
큐를 사용하여 글자를 순차적으로 전달하였고 Langchain의 BaseCallbackHandler 를 사용했다. BaseCallbackHandler에 대해서는 조금 더 공부가 필요한 듯 보인다.
API
class Question(BaseModel):
question: str
@router.post(
path='/text-stream/',
description="Enter the question"
)
@inject
async def generate_text_streaming(
query: Question,
rag_service: Rag_Service = Depends(Provide[Container.rag_service]),
):
return StreamingResponse(rag_service.generate_text_streaming(query), media_type='text/event-stream')
Service
class Rag_Service:
def __init__(self):
self.streamer_queue = Queue()
self.streaming_handler = StreamingHandler(queue=self.streamer_queue)
self.LLM = ChatOpenAI(
streaming=True,
callbacks=[self.streaming_handler]
)
def generate(self, llm, text):
llm.invoke(text)
def start_generation(self, llm, text):
thread = Thread(target=self.generate, kwargs={"llm": llm, "text": text})
thread.start()
async def generate_text_streaming(self, text: Question):
self.start_generation(self.LLM, text.question)
while True:
value = self.streamer_queue.get()
if value == None:
break
yield value
self.streamer_queue.task_done()
await asyncio.sleep(0.1)
StreamingHandler
class StreamingHandler(BaseCallbackHandler):
def __init__(self, queue) -> None:
super().__init__()
self._queue = queue
self._stop_signal = None
print("Custom handler Initialized")
def on_llm_new_token(self, token: str, **kwargs) -> None:
self._queue.put(token)
def on_llm_start(
self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
) -> None:
print("generation started")
def on_llm_end(self, response: LLMResult, **kwargs: Any) -> None:
print("\n\ngeneration concluded")
self._queue.put(self._stop_signal)
반응형
'Framework' 카테고리의 다른 글
[Langchain] 응답 캐시 동작 파악 (0) | 2024.05.28 |
---|---|
[Langchain] 쿼리에 Redis 캐싱을 적용하기 (0) | 2024.03.19 |
[sqlalchemy] @contextmanger로 트랜젝션 관리 (0) | 2024.03.13 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 프로그래머스
- 우선순위큐
- t-test
- 보안
- 카카오페이
- 파이썬
- synflooding
- 자료구조
- 리눅스
- Ai
- 다이나믹프로그래밍
- Python
- 코딩테스트
- java
- LangChain
- 시간초과
- 정보보안
- 백준
- llm
- FastAPI
- 보안기사
- 분산시스템
- 정보보안기사
- linux
- lightsail
- 그리디
- 카카오페이면접후기
- springboot
- t검정
- 딥러닝
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함