MiniCPM-o 4.5 한국어 성능도 잘 나올까?
MiniCPM-o 4.5의 한국어 성능을 영어와 나란히 비교 측정했습니다. 이미지 설명, OCR, 문서 추출에서 한국어가 잘 되는 부분과 무너지는 지점, 그리고 프롬프트가 아닌 아키텍처에서 오는 근본 원인을 분석합니다.

MiniCPM-o 4.5 한국어 성능도 잘 나올까?
MiniCPM-o 4.5는 영어와 중국어에 최적화된 옴니 모델입니다. 그렇다면 한국어는 얼마나 될까요?
동일한 이미지에 한국어와 영어로 같은 질문을 던지고, 출력을 나란히 비교했습니다. 이미지 설명, OCR, 문서 추출, 파인튜닝까지 실제로 돌려본 결과를 정리합니다.
결론부터 말하면: 한국어는 됩니다. 하지만 흥미로운 문제들이 있고, 그 원인은 프롬프트가 아니라 더 깊은 곳에 있습니다.
테스트 환경
관련 포스트

AI Research
GPT-4o가 유독 빠른 이유: 멀티모달과 옴니(Omni) 모델의 결정적 차이
파이프라인 방식(STT→LLM→TTS)의 텍스트 병목 문제와 옴니 모델의 네이티브 토큰 융합 방식을 토큰 수준에서 비교 분석합니다. GPT-4o와 MiniCPM-o가 빠른 진짜 이유를 설명합니다.

AI Research
온디바이스 GPT-4o의 등장? MiniCPM-o 4.5 완벽 분석 및 활용 가이드
OpenBMB의 MiniCPM-o 4.5는 9B 파라미터로 GPT-4o급 비전 성능을 달성하고, Int4 양자화 시 11GB VRAM으로 구동됩니다. 아키텍처, 벤치마크 분석, 실전 활용 가이드까지 깊이 있게 다룹니다.

AI Research
PaperBanana: AI가 논문 그림까지 자동으로 그려준다
Google과 북경대가 발표한 PaperBanana는 논문 텍스트만으로 출판 수준의 학술 일러스트레이션을 자동 생성하는 에이전트 시스템입니다.