Tencent が Unified_Audio_Schema をリリース ── 聴いて話す、音声の理解と生成を統合したマルチモーダルモデル
Tencentがテキストと音声の相互入出力に対応したUnified Audio Schemaを公開。感情や非言語情報の理解・生成が可能に。
Tencentがテキストと音声の相互入出力に対応したUnified Audio Schemaを公開。感情や非言語情報の理解・生成が可能に。
OpenAIがライフサイエンス特化モデルGPT-Rosalindを発表。創薬やゲノム解析、タンパク質推論を加速するフロンティア推論モデル。
OpenAIのCodexアプリが大幅アップデート。computer useや画像生成、メモリ機能が追加され、開発者のワークフローが劇的に進化した。
Hugging Faceがエージェント生成PRの問題点を告発。transformersの設計思想をエージェントが理解せず、メンテナーの負担が増大している現状を報告。
OpenAIがサイバー防衛エコシステム強化を発表。特化モデル「GPT-5.4-Cyber」と1000万ドルのAPIグラントを提供し、グローバルな防御力向上を目指す。
AlibabaがQwen3.6-35B-A3Bをリリース。総パラメ35B/アクティブ3Bの超軽量設計で最大101万トークンを処理し、コーディングエージェント性能が大幅向上。
Sentence Transformersでマルチモーダル検索モデルを学習・ファインチューニングする手法が公開。自前データで鍛えれば4倍の巨大モデルをも凌駕する。
OpenAIがChatGPTのパーソナライズ手法を解説。custom instructionsとmemoryを活用して、より関連性が高く一貫性のある回答を得るアプローチを紹介。
Tencentがオープンソースで公開したHY-World 2.0は、テキストや画像から編集可能なリアル3D空間を直接生成する革新的なモデルです。
OpenAIがAgents SDKをアップデート。ネイティブのサンドボックス実行を搭載し、安全に長時間稼働するエージェント開発が可能になった。