Anthropic、Claude Fable 5 / Mythos 5 を公開(6/12 に停止)
Opus の上位ティアとして 6/9 一般公開。SWE-bench Verified で Mythos 5 が 95.5%・Fable 5 が 95.0%(Opus 4.8 の 88.6% を上回る)と報告、Simon Willison は「relentlessly proactive」と評価。ただし 6/12 に輸出管理指令で停止。
直近 7 日間·2026-06-08 〜 2026-06-15·全般
Last updated:
ClaudeForFoundationModels Swift package が対応、LanguageModelSession API のまま Claude を server-side model として駆動可能。(source)Opus の上位ティアとして 6/9 一般公開。SWE-bench Verified で Mythos 5 が 95.5%・Fable 5 が 95.0%(Opus 4.8 の 88.6% を上回る)と報告、Simon Willison は「relentlessly proactive」と評価。ただし 6/12 に輸出管理指令で停止。
Gemma 4 アーキ上の 26B-class MoE(総 25.2B / active 約 3.8B)を拡散デコードで動かす。block 256 token を並列に denoise し text/コード穴埋めに強い。品質は自己回帰比でやや低めだが H100 単体で 1,000+ tok/s。Apache 2.0 で HF/Kaggle/Vertex 配布。
30B 総 / 3B active の MoE agentic coding model。256K context、FP8 で 1×H100 動作。Artificial Analysis Coding Index 33.4 を主張(ベンチは未独立検証)。
coding/agent 特化の 1T-A32B MoE(384 experts, 256K)。K2.6 比で reasoning token 消費を約 30% 削減しつつ coding 性能向上、median 入力で約 180 tok/s。HF・Kimi API で配布。
Apple の Foundation Models framework(OS 27 beta の server-side LM API)に Claude を LanguageModel 準拠で載せる package。respond(to:)・streaming・@Generable 構造化出力・client/server tool が on-device model と同じ session API で使え、fixedEffort: で .xhigh/.max も指定可。iOS 開発者には今週最大の実装ネタ。
nested sub-agents、plugin search に加え、セッションを別マシンで開始しスマホで継続する remote control、split view・assistant message の chapter pin・inline diff comment を備えた desktop GUI 刷新。
open-weight 推進の論陣を張るサイトが大きな議論に。DiffusionGemma/Kimi/Cohere の open release 連発という今週の文脈と呼応。
LLM agent の記憶を「検索」ではなくグラフ上の「再構成」として扱う手法。HF Daily Papers で上位(53 upvotes)。
agent の手続き的方策最適化。HF Daily Papers で議論活発(60 upvotes / 46 comments)。
Claude に化学タスクを担わせる Anthropic の research(HN 90pt)。科学ドメインでの agent 応用例。
80.3%(Fable 5, Anthropic 自前 scaffold)/ 59.1%(gpt-5.4 xHigh, Scale SEAL)/ 47.1%(Opus 4.6, Scale 私的セット)と scaffold・data split で大きく割れる。横断比較時は前提確認が必須。
AI が強力でも「何を作るか」の決定と品質検証がボトルネックとして残るという論考。開発者の役割論。
今回のダイジェスト生成で sweep した channel 一覧。取得できなかったソースは取消線で表示します。