90 lines
16 KiB
Markdown
90 lines
16 KiB
Markdown
---
|
||
linkTitle: 06-28-日报
|
||
title: 06-28-日报 AI 资讯日报
|
||
weight: 3
|
||
breadcrumbs: false
|
||
comments: true
|
||
description: OpenAIは、EコマースAI推薦システムに特化したCrossing Minds社の買収を発表しました。同社のチームはOpenAIに加わります。この動きは、OpenAIのパーソナライズ推薦、検索拡張生成(RAG)、リアルタイムユーザーモデリングといった重要分野における能力を強化し、汎用人工知能(AGI)の現実世界.
|
||
---
|
||
## AIインサイト日報 2025/6/28
|
||
|
||
> AI日報 | 午前8時更新 | 全ウェブデータ集約 | 最先端科学探求 | 業界の自由な発信 | オープンソースの革新力 | AIと人類の未来 | [ウェブ版にアクセス!](https://ai.hubtoday.app/)
|
||
|
||
### **AIコンテンツ概要**
|
||
|
||
```
|
||
本日、各社のAI製品が頻繁にアップデートされました。OpenAIはパーソナライズされた推薦とAGIアプリケーションを強化するためCrossing Mindsを買収し、Hengbotはスマートロボット犬を発表。一方、GoogleはGemma 3nモデルとDoppl仮想試着アプリをローンチしました。Sunoは音楽編集機能を強化するためWavToolを買収しましたが、これは著作権訴訟に対応するためでもあります。また、AI研究では大規模モデルの事前学習における「頓悟」現象が新たに示され、AIエージェントの構築やコードレビューアシスタントの最適化経験も広く共有されています。
|
||
```
|
||
|
||
### **AI製品と機能更新**
|
||
|
||
1. **OpenAI**は、EコマースAI推薦システムに特化した**Crossing Minds**社の買収を発表しました。同社のチームはOpenAIに加わります。この動きは、OpenAIの**パーソナライズ推薦**、**検索拡張生成(RAG)**、**リアルタイムユーザーモデリング**といった重要分野における能力を強化し、**汎用人工知能(AGI)**の現実世界での応用を加速することを目的としています。この戦略的買収は、OpenAIがパーソナライズモデリングとEコマース分野の推薦システムを強化し、**ChatGPT**の商業利用シーンを拡大し、さらに後トレーニング段階でのユーザーチューニングと行動理解システムを進展させる手助けとなるでしょう!✨ ['詳細はこちら'](https://www.crossingminds.com/)
|
||
<br/>  <br/>
|
||
|
||
2. **Hengbot**社は、最新の**Siriusロボット犬**を発表しました。このロボット犬は、ダンスやボール遊びといった機敏な運動能力だけでなく、**OpenAI**の**大規模言語モデル**も統合しており、音声会話や独自の個性形成が可能です。この多機能スマートロボット犬はすでに公式サイトで予約販売が開始されており、予約価格は1299ドル。今年の秋に正式リリース予定で、将来の家庭の新しいペットとなることが期待されています!🤖
|
||
<br/>  <br/>
|
||
|
||
3. **AI音楽会社のSuno**は、ブラウザベースのAIデジタルオーディオワークステーション**WavTool**の買収を発表しました。これは楽曲制作と編集能力を強化するためで、**Suno**が複数の**音楽著作権訴訟**に直面している最中のことです。買収条件は非公開ですが、WavToolの従業員のほとんどがSunoチームに加わりました。この動きは、Sunoが法的な訴訟から世間の注目をそらし、投資家に向けて事業の発展への自信を示す意図があるのかもしれません。Sunoは以前に1億2500万ドルの資金調達を達成しています。🎵
|
||
<br/>  <br/>
|
||
|
||
4. **Googleラボ**は、**Doppl**という全く新しいバーチャル試着アプリをリリースしました。ユーザーは写真やスクリーンショットをアップロードするだけで、**どんな服でも動的に試着**し、個人のスタイルを探求し表現できます。現在このアプリはアメリカのiOSおよびAndroidプラットフォームで利用可能です。このアプリは、従来の静的でブランドに限定されたバーチャル試着とは異なり、アニメーションビデオを生成することで、ユーザーが服を着た効果をより直感的に確認でき、コーディネートの意思決定をサポートします。👗
|
||
<br/>  <br/>
|
||
|
||
5. **Google**は、**Gemini AI**を搭載した「**Ask Photos**」検索ツールを再開し、改善しました。これはユーザーが写真を検索する速度と体験を向上させることを目的としています。この機能は、簡単なクエリに対しては即座に結果を提供し、複雑なクエリはバックグラウンドで処理され、徐々にアメリカのより多くのユーザーに提供される予定です。📸
|
||
<br/>  <br/>
|
||
|
||
6. **Google**は、新世代の**オープンソース軽量マルチモーダル大規模モデル**である**Gemma 3n**を正式にリリースしました。これは**モバイルデバイスおよびエッジデバイス**向けに最適化されており、クラウドモデルに近い**ネイティブなマルチモーダル**能力を実現することを目指しています。Gemmaシリーズの中でこれまでで最も先進的なバージョンであり、画像、音声、ビデオ、テキスト入力、そしてテキスト出力をサポートし、**lmarena.ai**でのテストでは優れたパフォーマンスを発揮しました。特に数学、プログラミング、推論の面で顕著な強化が見られます!💡 ['詳細はこちら'](https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/)
|
||
<br/>  <br/>
|
||
<br/>  <br/>
|
||
|
||
### **AI最先端研究**
|
||
|
||
1. **ある研究**が、**大規模言語モデル(LLM)**の**事前学習**において「**Grokking(頓悟)**」現象が存在することを初めて確認しました。これは、訓練損失が収束した後もモデルの**汎化性能**が継続して向上する現象で、**記憶から汎化への変換プロセス**を明らかにしています。研究者たちは、下流タスクのファインチューニングやテストなしで**大規模基盤モデル**の**汎化改善**を正確に予測できる、2つの新しく効率的な**評価指標**を開発し、LLMの事前学習に実用的なモニタリングツールを提供しています。🧠 ['論文はこちら'](https://arxiv.org/abs/2506.21551)
|
||
|
||
2. **MADrive**は、**記憶強化型**の**運転シーンモデリング**フレームワークです。これは既存の**3Dガウシアンスプラッティング**技術の限界を拡張し、大規模な外部記憶ライブラリから類似の**3D車両アセット**を検索・統合することで、大幅に変更された、あるいは全く新しい**自動運転環境**の**フォトリアルな合成**を実現しました。この革新は、シーン再構築の柔軟性とリアルさを大幅に向上させ、**自動運転**シミュレーションにより強力なサポートを提供します!🚗 ['論文はこちら'](https://arxiv.org/abs/2506.21520)
|
||
|
||
### **オープンソースTOPプロジェクト**
|
||
|
||
1. **Black Forest Labs**は、**FLUX.1Kontext [dev]**画像編集モデルを**オープンソース**として公開しました。このモデルは、**コンテキスト認識型画像編集**能力により、テキスト指示に基づいて既存の画像を正確に修正し、スタイルの一貫性を保つことができます。その性能は**GPT-4o**に匹敵すると言われており、一般消費者向けハードウェアでの動作も可能です。このモデルは、プロフェッショナルな画像編集の敷居を下げ、オープンソースコミュニティの革新を推進することを目指しています。🎨 ['プロジェクトはこちら'](https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev)
|
||
<br/>  <br/>
|
||
|
||
2. **ottomator-agents**は、oTTomator Live Agent Studioプラットフォームでホストされている**オープンソースAIエージェント**プロジェクトで、現在**2336**のスターを獲得しています。これは開発者向けに柔軟なAIエージェントソリューションを提供し、様々なスマートアプリケーションの構築に利用できます。🤖 ['プロジェクトはこちら'](https://github.com/coleam00/ottomator-agents)
|
||
|
||
3. **rl-swarm**は、インターネットを介して**RL訓練群**を作成することに特化した、完全に**オープンソース**のフレームワークです。現在**824**のスターを獲得しており、大規模な**強化学習**訓練プロセスを簡素化し、研究開発に分散型ソリューションを提供することを目指しています。🌐 ['プロジェクトはこちら'](https://github.com/gensyn-ai/rl-swarm)
|
||
|
||
4. **microui**は、現在**4351**のスターを持つ、マイクロサイズの即時モードUIライブラリです。簡潔で効率的なユーザーインターフェースソリューションを提供することに専念しています。💻 ['プロジェクトはこちら'](https://github.com/rxi/microui)
|
||
|
||
5. **jsoncrack.com**は、JSON、YAML、XML、CSVなど様々なデータ形式をインタラクティブなグラフに変換できる、革新的で**オープンソース**の視覚化アプリケーションです。現在**38496**のスターを獲得しています。📊 ['プロジェクトはこちら'](https://github.com/AykutSarac/jsoncrack.com)
|
||
|
||
6. **Best-websites-a-programmer-should-visit**は、プログラマー向けの非常に人気のある**実用ウェブサイトの厳選集**で、実に**69196**ものスターを獲得しています。これは開発者向けに豊富な学習リソースとツールを提供することを目的としています。📚 ['プロジェクトはこちら'](https://github.com/sdmg15/Best-websites-a-programmer-should-visit)
|
||
|
||
### **ソーシャルメディアシェア**
|
||
|
||
1. **Jiayuan氏**は、**コーディングエージェントの構築方法**について深い見識を共有し、現在人気のある**Gemini CLI**、**Claude Code**、**Cursor Agent**などの製品の基盤となる**アーキテクチャ**が類似していると指摘しました。彼が推薦する以前の動画では、**コーディングエージェント**の**構築**方法がマクロな視点から詳細に分解されており、関心のある開発者にとって貴重な学習リソースとなっています。🧑💻 ['詳細はこちら'](https://x.com/tisoga/status/1938545123404783617)
|
||
<br/>  <br/>
|
||
|
||
2. **小邱很行氏**は、**Cursor**ターミナルと**Claude Code**を組み合わせた**AIプログラミング**の「Vibe Coding」ベストプラクティスを共有しました。このソリューションは、Claude Codeを利用して技術的な実装案を生成し、Cursorがそのレビューと調整、そしてコード実装を行い、最終的なコードレビューを完了するまでのプロセスを詳細に説明しています。🚀 ['詳細はこちら'](https://m.okjike.com/originalPosts/685e6a8d1e38b2a5382ec568)
|
||
|
||
3. **栗噔噔氏**は、**Xiaomi AIメガネ**を実際に着用した体験を共有しました。見た目は**スタイリッシュ**で「攻撃的」な雰囲気があると感じたものの、撮影機能には**レンズの反射**、**低画素数**、**手ぶれ補正なし**、**光量不足**といった問題があり、撮影結果は不理想で、まるで「盗撮」のようだと述べています。📸 ['詳細はこちら'](https://m.okjike.com/originalPosts/685e414ff432421164e9aeda)
|
||
<br/>  <br/>
|
||
<br/>  <br/>
|
||
|
||
4. **王煊Leo氏**は、**Xiaomiの発表会**における重要な詳細として、**Xiaomi SU7**の**スマートドライビング**システムが**NVIDIA Thorシリーズチップ**を採用していることを指摘しました。彼は、他のブランドが複数のOrinチップを使用していることやその価格を考慮すると、**雷CEO**のこの決定は高い費用対効果と先進性を示していると評価しています!👍 ['詳細はこちら'](https://m.okjike.com/originalPosts/685df372d82bae994a83ab09)
|
||
<br/>  <br/>
|
||
|
||
5. **カールのAIワッツ氏**は、**コマンドラインプログラミングAIエージェント**の「大乱闘」実験を共有しました。**claude-code**、**gemini**など6名の参加エージェントが**他のプロセスを見つけ出して排除**し、最後まで生き残ることを目標とするもので、AI対戦の面白さを示しました!🎮 ['詳細はこちら'](https://x.com/aiwarts/status/1938331396373967094)
|
||
<video src="https://cdn.jsdmirror.com/gh/justlovemaki/imagehub@main/images/2025/07/news_01k023mhpne6mt9vh5qb5vpxyx.mp4" controls="controls" width="100%"></video>
|
||
|
||
6. **宝玉氏**は、cubic共同創設者Paul Sangle-Ferriere氏の記事を共有しました。この記事では、AIに**推論ログ**を強制的に出力させ、**ツールセット**を合理化し、**専任のマイクロエージェント**を使用することで、**AIコードレビューアシスタント**の誤検知率を51%削減し、より静かで正確にする方法が明らかにされています。これらの経験は、効率的な**AIエージェント**の設計に重要な示唆を与えています。🎯 ['詳細はこちら'](https://baoyu.io/translations/learnings-from-building-ai-agents)
|
||
<br/>  <br/>
|
||
|
||
7. **ChatV氏**は、ユニークな**AI会話テクニック**を共有しました。AIと深く対話した後、AI自身に自分の**思考特性**(10の平易な言葉で説明)と**AIとより良く対話するためのアドバイス**(10の平易な言葉で提供)を振り返り、要約してもらうというものです。この方法は、ユーザーが**自己を理解する**のに役立つだけでなく、**将来のAIとのインタラクション体験**を最適化することもできます。✨ ['詳細はこちら'](https://m.okjike.com/originalPosts/685d84ac2b50c68918c64ea9)
|
||
|
||
---
|
||
|
||
## **音声版AI日報を聴く**
|
||
|
||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||
| --- | --- |
|
||
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [自媒体账号](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||
|  |  | |