[TheVerge] 수십 년에 걸쳐 축적된 자체 기사로 AI 챗봇을 가르치고 있는 파이낸셜 타임즈

 


The Verge 기사 번역. 원문

수십 년에 걸쳐 축적된 자체 기사로 AI 챗봇을 가르치고 있는 파이낸셜 타임즈


Emma Roth, Quentyn Kennemer



The Financial Times에는 구독자들이 묻는 질문에 대답할 수 있는 ASK TF라는 새로운 생성형 AI 챗봇이 있다. (ChatGPT, Copilot, 혹은 Gemini처럼) 사용자는 자신이 알고 싶은 모든 것에 대한 선별된 자연어 답변을  기대할 수 있으나, 그 답변들은 설명하기 힘들거나, 현재 진행 중인 법적 소송에 대한 정보보다는, 수십 년간 쌓여 온 게시된 기사들로부터 정보를 가져온다. 따라서, 페투치니 알트레도에 대한 최고의 요리법 같은 것은 기대하기 힘들다, 


“Microsoft의 AI 제품을 운영하는 사람은 누구입니까?”라는 질문을 던졌을 때, 이 툴은 가장 최신의 소식을 답변하였으며, 이번 주 Microsoft가 DeepMind 공동 창업자인 Mustafa Suleyman을 새로운 AI 팀의 책임자로 고용했다는 소식을 참조했다:


"Mustafa Suleyman은 현재 Microsoft AI 책임자로서 Microsoft의 소비자 대상 AI 제품 및 부서를 운영하며 Satya Nadella에게 직접 보고합니다 [1,2,3]. 그는 개인 소비자용 생성 AI 개발에 대한 Microsoft의 초점을 확장하기 위해 Inflection AI에서 영입되었습니다 [1,2,3,4,6]"


괄호 안의 숫자는 정보를 가져온 FT 기사에 해당하며, 답변 아래에 나열된다.  또한 해당 기사가 작성된 기간도 제공하는데, 이 Microsoft에 대한 질문의 경우, 2023년 3월 1일부터 2024년 3월 20일까지의 정보를 가져왔다고 나와 있다.


하지만 일부 답변에서는 일관성이 없는 답변 역시 발견할 수 있었다. 테스트 당시, 툴에는 2024년 미국 2024년 미국 대통령 선거에 누가 출마하는지에 대한 질문의 답변에는 이미 선거에서 탈락한 Nikki Haley가 포함되어 있었다. 


이 툴은  비즈니스 전문가 및 기관을 대상으로 하는 FT Professional 티어에 해당하는 유료 구독자들에게 제공되는 기능이다. Ask FT는 현재 Antrhopic에서 개발한 LLM (대형 언어 모델) 인 Claude에 의해 구동되지만, 변경될 수도 있다. The Verge와의 인터뷰에서 FT의 최고 제품 책임자인 Lindsey Jayne은 이 출력 결과를  "Model Agnostic (모델에 구애받지 않고 독립적으로 해석 가능한 결과)"라 보고, 어떤 모델이 우리의 요구사항에 가장 잘 부합하는지를 확인하고 있다고 말했다.


이 툴은 CHIPS 법에 따라 인텔이 미 정부로부터 얼마의 자금을 지원받았는가와 같은 시사 문제에 대한 질문만이 아니라, 암호화폐가 환경에 미치는 영향과 같은 더욱 광범위한 질문에 대한 응답 역시 제공한다. 답변을 제공한 후 툴은 FT의 아카이브를 수집하고, 인용을 통해 관련된 정보를 요약한다.


Ask FT는 또한 FT의 아카이브를 더욱 심도있게 파악하는 질문에도 답할 수 있다. YouTUbe가 어떻게 시작되었느지를 묻는 질문에 대해,  Ask FT는 Chad Hurley, Steve Chen, Jawed Karim이 2005년 2월에 설립했다고 정확하게 대답했다.


Jayne은 "우리는 내부적으로 수많은 테스트를 수행했으며, 이를 이용하여 모델을 가르치는 방법과,  코드를 구성하는 방법을 개선했습니다."라고 말했다, "500 개의 첫 번째 테스트 그룹에서, 우리는 모든 질문과 답변,  동시에 사용자의 피드백 역시 추적했습니다."


작년에 우리는 Macworld , PCWorld 및 Tech Advisor와 같은 마케팅 회사 Foundry가 가지고 있는 디지털 아울렛들이 배포한 비슷한 툴들을 시험에 보았다. 하지만 그 당시에는 그 툴들은 Ask FT만큼은 유용하지 않았다. 나의 동료인 Mia Sato는 마지막 iPod Nano가 언제 출시되었는지 같은 간단한 질문에서도 부정확한 결과를 출력한다는 사실을 발견했었다. 


"지속적으로 개선되고 이와 같은 순간을 만들어내지 못한다면 135년의 역사를 가진 기관이 될 수 없겠지요. " Jayne은 말한다. "하지만 영리해지고, 과대광고된 트렌드에 올라타지 않으려 노력하지 않는다면, 사람들은 그저 이 툴을 재미를 위해 사용하고 곧 잊어버리게 될 거에요." 


이 챗봇은 아직 대부분의 가입자들에게는 공개되지 않았다. Ask Ft는 FT가 테스트하고 평가하는 동안은 계속 베타 버전으로 유지될 예정이다.


댓글

이 블로그의 인기 게시물