[AI] Grok-3 사용 소감 - 리무스BBS

추론 성능에 대해 맨날 해보는 잔돈 테스트를 해 보았다.

 

이 테스트를 통과한 AI는 그렇게 많지 않았다. openAI의 GPT-4o 이후 버전에서는 거의 통과 (틀린 경우도 있음)했고,

나머지 메이저 LLM들은 모두 틀렸고, 국내 AI 중에서 업스테이지 솔라는 통과했었는데, 이 솔라의 경우는 아마도 시계열에 따른 사건 추론 기능이 따로 구현되어 있는 것 같았다.

 

느낌은…

 

대화는 꽤 자연스럽고 괜찮네. 아직 추론은 가정 설정이 완전하지 않아서, 상세한 설명을 하지 않으면 원하는 답이 나오지 않을 가능성이 큰 것 같다. 자기 편의적으로 (합리적이 아닌) 가정을 하는 것이지…

 

단점은, 무료 버전은 두시간에 15건의 대화가 가능하다. 더 쓰려면 x.com 의 Premium+ 옵션에 가입해야 하는데, 월 5만원꼴..

 

#GROK-3 #LLM

----------

머루아저씨
✨ Full-stack Developer | 최신 기술 애호가
💻 현개발환경: PHP 8.4, Swoole, MongoDB, Redis, Docker
⚙️ Ubuntu/Linux 환경 & VS Code SSH 기반 작업
📚 "지속 가능한 개발, 효율적인 코드"를 지향합니다.