본문 바로가기
Tech 뉴스

xAI, ‘Grok Vision’ 공개… 이제 카메라로 세상을 인식하는 인공지능으로 진화

by truthblaze7 2025. 4. 23.

일론 머스크(Elon Musk)의 인공지능 기업 xAIGrok 챗봇에 실시간 시각 인식 기능(Grok Vision)을 추가했습니다. 이제 사용자는 스마트폰 카메라로 물체, 문서, 간판 등을 비추고 Grok에게 그에 대한 질문을 할 수 있습니다. 이 기능은 구글의 Gemini나 오픈AI의 ChatGPT가 제공하는 실시간 비전 기능과 유사합니다.


📱 ‘Grok Vision’, iOS 앱부터 적용 시작

  • iOS용 Grok 앱에서 사용 가능
  • Android 앱은 아직 미지원 상태
  • 카메라를 제품, 간판, 문서 등 다양한 대상에 비추고 질문 가능
    예:
    • “이 간판에 뭐라고 쓰여 있어?”
    • “이 제품은 어디서 살 수 있어?”
    • “이 문서는 무슨 내용이야?”

🌐 음성 모드 다국어 지원 및 실시간 검색 기능도 추가

xAI는 Grok의 음성 모드에 다국어 오디오 인식 기능과 실시간 웹 검색 기능도 새롭게 도입했습니다. 다만, 해당 기능은 Android에서도 사용 가능하지만 ‘SuperGrok’ 요금제($30/월) 구독자에 한정됩니다.


🧠 최근 Grok의 급격한 진화 흐름

Grok은 최근 몇 주 사이 다음과 같은 고급 기능을 잇따라 탑재하며 ChatGPT, Gemini 등 경쟁 모델과 본격 경쟁 중입니다:

  • ‘메모리’ 기능 도입: 과거 대화 내용을 바탕으로 개인화된 응답 가능
  • 문서 및 앱 생성용 ‘캔버스’ 도구 탑재
  • API 출시, Grok 3 및 Grok 3 Mini 모델 활용 가능
  • 시각 인식 추가(Grok Vision): 챗봇이 실제 현실 세계와 상호작용 시작

🧠 xAI의 목표: ChatGPT·Gemini를 대체할 수 있는 ‘실용형 AI’

일론 머스크는 “검열되지 않은 정치적으로 중립적인 AI”를 강조하며 Grok을 출시했습니다. 최근에는 기능면에서도 빠르게 ChatGPT, Gemini 등과 격차를 좁히고 있으며, 특히 X 플랫폼과의 긴밀한 통합, 그리고 Grok Vision과 같은 실시간 센서 기반 기능을 통해 차별화를 시도하고 있습니다.