こんにちは!AIサービス開発室の鈴木生雄です。ポッドキャストを更新しました。
注目ニュース
DeepSeek-OCRリリース!コンテキストの視覚圧縮がLLMのテキスト情報処理効率向上の道を拓く?
2025年10月21日、DeepSeekは 画像理解を使ってテキスト文脈を圧縮し、LLMの長文処理を高速・低コスト化する新モデルDeepSeek-OCRを発表しました。現在のLLMは、テキストをトークンと呼ばれる単位で一語一語順番に、他のトークンとの関連性を計算しつつ処理しているため、長いテキストコンテンツの処理において計算量が爆発するという課題に直面しています。この課題に対する潜在的な解決策としてDeepSeek-OCRでは、視覚圧縮という、テキストを一枚の画像としてとらえてその画像をテキスト情報の効率的な圧縮媒体として活用するアプローチをとっています。論文では10分の1のデータサイズにしてもOCR精度97%を達成したと報告されていることから、効率の良い情報の圧縮手法といえそうです。今後はこの視覚圧縮の活用によって、LLMの長文脈処理能力の向上が期待されます。日本には「百聞は一見に如かず」ということわざがありますが、言葉よりも画像の方が、情報量が多いということを、LLMの文脈で定量的に検証している点が独自でとても面白いと思いました。

対象エピソード:
- Ep.656 DeepSeek-OCR──“画像で圧縮するLLM”が長文処理の常識を変える(2025年10月23日配信)
ChatGPTのWebブラウザ Atlas登場!
2025年10月21日、OpenAIは“ChatGPTを中核に据えたブラウザ”ChatGPT Atlasをリリースしました。
肝になる機能は二つ。
- Browser memories:閲覧したサイトの“要点”をメモとして保持し、後から記憶を呼び出してチャットに混ぜてくれる。
- Agent mode:AIエージェントがタブを開き、リンクをたどり、作業を進める。買い物のカート詰めや予定の調整、要点整理など、ページを跨ぐ反復作業を肩代わりしてくれる。利用にはPlus以上のサブスクが必要。
なお、提供が、不思議なことに、macOSで開始(Windows, iOS, Androidはまだ)となっています。Microsoftとアライアンスを組んでいるにも関わらず、なぜでしょうかね。早速、自宅のMac miniにインストールして「Agent mode」でトマトジュースの購入を依頼してみたところ、商品をAmazonのカートに入れるところまでやってくれました。(ログイン済の場合、決済までするかは未検証です。)「小さなパックのものを1箱」という少しざっくりとした指示をしたのですが、きちんと私が想定した商品を選んできたのには感心しました。今回はECサイトにAmazonが選択されましたが、何も指定しないとAmazonが選ばれるのかという点が気になりました。最近、SEO(Search Engine Optimization)に代わるAEO(Agent Engine Optimization)という概念が出てきたように、AIエージェントに選ばれないと商売にならないという状況になっていくのかもしれません。

対象エピソード:
- Ep.657 ChatGPT Atlas登場──“ブラウザそのものが相棒”になる日(2025年10月23日配信)
ラインナップ
- Ep.657 ChatGPT Atlas登場──“ブラウザそのものが相棒”になる日(2025年10月23日配信)
- Ep.656 DeepSeek-OCR──“画像で圧縮するLLM”が長文処
理の常識を変える(2025年10月23日配信) - Ep.655 Claude Code、WebとiOSに登場──“並列エージェント”を安全
サンドボックスで走らせる新ワークフロー(2025年10月23 日配信) - Ep.654 IBM×Groq提携──watsonx Orchestrateに“超速推論”を直結、エージェント実装
の現実解(2025年10月23日配信) - Ep.653 Claude for Life Sciences──研究の“段取り”まで面倒を見るAIへ(2
025年10月23日配信) - Ep.652 Veo 3.1、Flowで“音と編集”が本格化──AI動画のコントロ
ールが一段上に(2025年10月23日配信) - Ep.651 NTT「tsuzumi 2」正式提供──“30Bを1GPUで”が国産AIの現実解に(
2025年10月23日配信) - Ep.650 AWS大規模障害──“US-EAST-1”から広がった波紋と
復旧までの約15時間(2025年10月23日配信) - Ep.649 DeepMind×CFS──AIが“点火”へ導くトカマク運転
(2025年10月23日配信) - Ep.648 ClaudeのAgent Skills──“フォルダひとつで専門家”をつくる新発想(2
025年10月23日配信) - Ep.647 TSMCアリゾナで“米国製”Blackwellウエハー誕生─
─AI時代のサプライチェーンが動き出す(2025年10月23 日配信) - Ep.646 マイクロン、中国のデータセンター向けサーバーメモリ撤退──ロ
イター報道が示す“地政学リスクの実相”(2025年10月23 日配信) - Ep.645 DeepSomatic──AIで腫瘍の体細胞変異を精密検出、
長短リード横断の新標準へ(2025年10月23日配信) - Ep.644 Claudeが職場の“引き出し”とつながる日──Micros
oft 365連携とエンタープライズ検索の全体像(2025年10月2 3日配信) - Ep.643 M5登場──GPUに“Neural Accelerator”を内蔵、AppleシリコンのAIが次
の段階へ(2025年10月23日配信) - Ep.642 Gemmaが見つけた“見えないがん”への抜け道──単一細胞A
Iが示した免疫賦活の新仮説(2025年10月23日配信) - Ep.641 QualcommがArduinoを買収へ──“UNO Q”でAIエッジはDIYから本格産業へ(2025年10月23
日配信)
