AI 브리핑 - 2026년 05월 15일

1. Anthropic, Claude Opus 4.7 출시 — 코딩 벤치마크 13% 향상

URL: https://www.anthropic.com/news/claude-opus-4-7

요약: Anthropic이 Claude Opus 4.7을 공식 출시했습니다. 93개 코딩 과제 벤치마크에서 Opus 4.6 대비 해결률이 13% 향상됐으며, 이전 두 모델이 풀지 못한 4개 과제를 단독 해결했습니다. 장기 자율 작업에서의 일관성과 자기 검증 능력이 크게 개선되어, 난이도 높은 코딩 작업을 감독 없이 위임할 수 있는 수준에 도달했다는 평가입니다. 이미지를 더 높은 해상도로 인식하는 강화된 비전 기능도 탑재됐으며, Claude 모든 제품과 API·Amazon Bedrock·Google Vertex AI·Microsoft Foundry에서 Opus 4.6과 동일한 가격($5/100만 입력 토큰, $25/100만 출력 토큰)으로 이용 가능합니다.

2. Google, AI 에이전트 'Gemini Spark' 사전 공개 — I/O 2026 주요 발표 예상

URL: https://9to5google.com/2026/05/14/gemini-spark-insight/

요약: Google이 Gemini 앱에 탑재될 일상형 AI 에이전트 'Gemini Spark'의 온보딩 화면이 유출됐습니다. Spark는 백그라운드에서 상시 실행되며, 이메일 수신함 정리·온라인 예약·연동 앱 작업 등을 능동적으로 처리합니다. 링크된 앱, 채팅 이력, 예약 작업, 방문 사이트, 위치 데이터, Personal Intelligence를 종합해 멀티스텝 작업을 자동화하는 방식입니다. 사용할수록 개인화가 강해지는 학습형 구조이며, 민감한 액션 전에는 사용자 승인을 요청합니다. Google I/O 2026(5월 19일) 키노트의 핵심 발표가 될 가능성이 높습니다.

3. OpenAI Codex, 모바일 앱으로 확장 — iOS·Android에서 AI 코딩 에이전트 원격 관리

URL: https://techcrunch.com/2026/05/14/openai-says-codex-is-coming-to-your-phone/

요약: OpenAI가 AI 소프트웨어 엔지니어링 에이전트 Codex를 iOS·Android ChatGPT 앱에서 사용할 수 있도록 확장합니다. 현재 프리뷰 단계로 모든 플랜에서 제공되며, 스마트폰에서 Codex 라이브 환경 모니터링, 출력 검토, 명령 승인, 모델 변경, 새 작업 시작이 가능합니다. 장기 실행 개발 워크플로를 데스크톱 없이 원격으로 감독할 수 있어, 에이전틱 코딩을 모바일 환경으로 본격 확장한 것으로 평가됩니다.