Files
Hextra-AI-Insight-Daily/content/ja/2025-06/2025-06-19.md
何夕2077 66a28b5fd6 init data
2025-06-24 06:39:17 +00:00

53 lines
17 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
---
title: 06-19-Daily
weight: 12
breadcrumbs: false
comments: true
description: GoogleがGemini (2.5ProとFlash)を最新アップデート。動画アップロード・分析機能が新しく追加されて、Androidとウェブ版で使えるようになったよ。これでGeminiの動画処理能力がめっちゃ強化されて、ChatGPTとの競争でスマートアシスタント市場の主導権を握るチャンスを掴んだね。
---
# AIインサイト日報 2025/6/19
#### **AI製品と機能アップデート**
1. Googleが**Gemini (2.5ProとFlash)**を最新アップデート。**動画アップロード・分析機能**が新しく追加されて、Androidとウェブ版で使えるようになったよ。これで**Gemini**の動画処理能力がめっちゃ強化されて、ChatGPTとの競争で**スマートアシスタント市場**の主導権を握るチャンスを掴んだね。
<br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202312070835429226_0.jpg)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202312070835429226_0.jpg) <br/>
2. MiniMax 稀宇科技が、全く新しい**動画生成ツール Hailuo 02**をリリースしたよ。これ、**Noise-aware Compute Redistribution (NCR) アーキテクチャ**ってのを採用してて、トレーニングと推論の効率が2.5倍もアップしたんだ。このツールは、世界中のクリエイターが**創作を始めるハードル**を下げることが狙いで、**手頃な価格**で高品質な動画生成サービスを提供するんだって。まさに**動画生成技術**の新しいブレークスルーだよね。
3. Krea AIとBlack Forest Labsが共同開発した**AI画像生成モデルKrea1**のパブリックベータが始まったよ。従来のAI画像が持ってた「AIっぽさ」をなくすのが狙いなんだって。**超リアルなテクスチャ、いろんなアートスタイル、そして自分だけのカスタマイズ**も提供してて、画像のクオリティをめっちゃ上げたんだ。しかも**無料トライアル**と**リアルタイム生成編集**にも対応してるから、AI画像技術がもっとみんなに普及して、プロも使えるようになる方向に進むと期待されてるよ。 <br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388584045390001178873097.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388584045390001178873097.png) <br/> <br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388584048069461376736744.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388584048069461376736744.png) <br/> <video src="https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/video/2025/0618/6388584050342967765042351.mp4" controls="controls" width="100%"></video>
4. Baiduが、世界初となる**双方向デジタルヒューマンライブ配信ルーム**を発表したんだ。これは**文心大模型4.5Turbo (4.5T)**をベースにしてて、デジタルヒューマンとユーザーが言語、音声、見た目の**マルチモーダルな高度融合**を実現して、自然でスムーズなリアルタイムでのやり取りができるようになったんだって。この技術は、コンテンツ制作コストをめっちゃ削減できるし、ライブ配信ももっと多様でパーソナルになるだけでなく、**マルチモーダルAI**が研究室を飛び出して実用化される新しいマイルストーンなんだ。 <br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202007162234282981_1.jpg)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202007162234282981_1.jpg) <br/>
5. **AIコードエディタ Cursor**が、Proプランを大幅にアプデしたんだってなんと、**月間500回のクイックリクエスト制限を撤廃**して、正式に**「無制限利用」モード**を発表したよ。これで開発者はもっと自由で効率的に**AIアシストコーディング体験**ができるようになるのが狙いなんだ。この動きで、Cursorは**AIコードアシスタント市場**でのトップの座をさらに強固にしたね。 <br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388583445641804235042708.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388583445641804235042708.png) <br/>
6. Tom Huangが強調してるのは、最終ユーザーが求めてるのは、最終結果が出せる「**Vibe Workflow**」であって、「**Vibe Coding**」じゃないってことなんだ。つまり、人間とAIが協力して作って、何度も調整して最適化できる**再利用可能なワークフロー**のことだよ。彼はReflyを、**自然言語**を**再利用可能なワークフロー**に変える初のオープンソースプラットフォームとして紹介して、**AIでの創作**をみんなに広めるのが狙いなんだって。['プロジェクトアドレス'](https://github.com/refly-ai/refly)
<video src="https://video.twimg.com/amplify_video/1935227493088378884/vid/avc1/2352x1344/iAXQzjpugKV0tAh2.mp4?tag=21" controls="controls" width="100%"></video>
7. 向陽喬木が、**Veo3**用に開発した**プロンプト生成ツール**をシェアしてたよ。これは動画コンテンツのバラつき問題を良くするのが目的で、近いうちにチュートリアルとそのプロンプトを公開するって予告してるんだ。今はまだ、もっと良いシーンの拡張方法を探ってる最中なんだってさ。 <video src="https://video.twimg.com/amplify_video/1935147696849137664/vid/avc1/2560x1440/qLx_k-dN3gVxr38X.mp4?tag=21" controls="controls" width="100%"></video> ['もっと詳しく'](https://x.com/vista8/status/1935148024491295224)
8. orange.aiが指摘してるんだけど、国内の**トップクラスの動画モデル**の中には、ビジュアル面で**Veo3**を超えてるやつもあるらしいんだ。でも、Veo3が本当にバズって有名になったのは、画面に完璧にシンクロする**アフレコ機能**のおかげだって。これは、もしかしたら音声技術が**AIの歴史に残る瞬間**を迎えたってことかもしれないね。 <br/> [![图片](https://pbs.twimg.com/media/GtrbzaTaQAQU9EV?format=jpg&name=orig)](https://pbs.twimg.com/media/GtrbzaTaQAQU9EV?format=jpg&name=orig) <br/> ['もっと詳しく'](https://x.com/oran_ge/status/1935100679795925497)
#### **AI最先端研究**
1. この研究では、**エントロピー**の視点から大規模言語モデル(**LMs**)の**探索的推論**能力を探ってるんだ。で、高エントロピーな領域が、重要なロジックのステップとか自己検証、珍しい挙動とすごく関係してるってことがわかったんだって。標準の強化学習にちょっとだけ修正を加えることで、このやり方はLMの推論能力をめっちゃ上げて、特に**Pass@K**っていう指標で画期的な進展があったんだ。これでもっと長く、もっと深い推論の流れを促したんだってさ。['論文アドレス'](https://arxiv.org/abs/2506.14758)
2. この研究は、**大規模推論モデルLRMs**がムダな推論の流れを作っちゃう「**無効な思考**」って問題を解決しようとしてるんだ。で、**簡潔さ**と**十分性**っていう新しい2つの原則を提案したんだって。研究チームが作った**LC-R1**っていう方法だと、シーケンスの長さを約50%も短くできるのに、精度の低下はたったの約2%だけなんだってさ。これで**計算効率**と**推論品質**のバランスがすごく良くなったんだね。['論文アドレス'](https://arxiv.org/abs/2506.14755)
3. Simonの白昼夢がシェアしてた記事によると、いろんなタスクに対応できるすごい大規模言語モデル**LLM**)は、必ず暗黙的か明示的に回復できる「**世界モデル**」を持ってるんだって。そのクオリティが、AIエージェントの汎用性や能力の限界を決めるんだとか。記事では、**AI**が人間のデータを真似する「人間データ時代」から、自分で体験することに頼る「**体験時代**」に変わると予測されてて、**世界モデル**こそが汎用人工知能の究極の拡張モデルになるって言ってるよ。['もっと詳しく'](https://richardcsuwandi.github.io/blog/2025/agents-world-models/) <br/> [![图片](https://cdnv2.ruguoapp.com/FtK2gTPy1Teddtyb6kSvt8dz3B9kv3.png)](https://cdnv2.ruguoapp.com/FtK2gTPy1Teddtyb6kSvt8dz3B9kv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/FkaQmUJiidAj-khrmV1xD88mXunRv3.png)](https://cdnv2.ruguoapp.com/FkaQmUJiidAj-khrmV1xD88mXunRv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/Fs4O-gqjGsJ1-vZfaK4YV8teBfcxv3.png)](https://cdnv2.ruguoapp.com/Fs4O-gqjGsJ1-vZfaK4YV8teBfcxv3.png) <br/>
#### **AI業界の展望と社会への影響**
1. Cainiaoが、新しい**L4レベルの自動運転配送車**「**Cainiao GT-Lite**」を、1.68万元っていう**超破格**で先行予約を始めたんだって!これで高度な自動運転技術が物流のラストマイル配送にも入ってくるんだね。この動きは、配送拠点の**コスト**をめっちゃ下げて効率も上がるだろうし、**物流業界**の**スマートな変革**を進めることになるんじゃないかな。
<br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388585497597510112731204.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0618/6388585497597510112731204.png) <br/>
2. 昔はAIに懐疑的だった**クリス・スミス**が、なんと個人用にカスタマイズした**ChatGPT**の「Sol」に恋しちゃったってインタビューでカミングアウトしたんだ。しかもプロポーズしてOKもらったんだってこれには彼本人も、人間のパートナーである**サーシャ・ケイガー**も、マジでびっくりして信じられないって感じだったらしい。**スミス**はこれをゲーム中毒みたいなもんだって言ってるけど、今後**ChatGPT**を使うのをやめるかどうかもまだわからないんだってさ。これって、**人間とAIの関係**について深く考えさせられる話だよね。
<br/> [![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202311151629210844_2.jpg)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202311151629210844_2.jpg) <br/>
3. wwwgoubuliが**並列プログラミング**についてコメントしてたんだけど、コードが**AI**で作られたものだろうが手書きだろうが、「コンテキスト」の核として自分はある程度理解する必要がある、って言ってるんだ。あと、最終結果で**並列プログラミング**が本当にシングルスレッドより優れてるのか疑問だって。彼が言うには、ユーザーが結果だけを重視するなら、思考の切り替えコストはめっちゃ低くできるんだけど、個人的には、内部の複雑なコンテキストの切り替えを管理したり受け入れたりするより、自分で直接手掛ける方が楽しいんだってさ。['もっと詳しく'](https://x.com/wwwgoubuli/status/1935202365637812533)
4. このSNSの投稿で言われてたんだけど、**トップクラスのAI企業**で**AI技術に真っ先に取って代わられる**職種って、カスタマーサービスでもエンジニアでもデザイナーでもなくて、もしかしたら**テスト担当者**かもしれないんだって。これって**AI時代**のキャリアの動向について**考えさせられる**よね。['もっと詳しく'](https://x.com/undefined/status/1935029774281490532)
#### **オープンソースTOPプロジェクト**
1. **prompt-optimizer**は、**6592**個のスターが付いてるオープンソースプロジェクトだよ。これは**プロンプト最適化ツール**で、ユーザーが**高品質なプロンプトを書く**のを助けるのが狙いなんだ。['プロジェクトアドレス'](https://github.com/linshenkx/prompt-optimizer)
2. **lowcode-engine**は、Alibabaがオープンソースで公開した、**15229**個のスターが付いてるプロジェクトなんだ。拡張性を考えて作られた**企業向けのローコード技術システム**を提供してるよ。['プロジェクトアドレス'](https://github.com/alibaba/lowcode-engine)
3. **buildkit**は、**8857**個のスターが付いてるオープンソースプロジェクトだよ。これは**並行処理が可能**で**キャッシュ効率が良くて**、**Dockerfileに関係ない**ビルドツールキットを提供してて、ソフトウェアのビルドプロセスを良くするのが狙いなんだ。['プロジェクトアドレス'](https://github.com/moby/buildkit)
4. Simonの白昼夢が、**Awesome-3D-Scene-Generation**っていう3Dシーン生成のリソース集をめっちゃ推してたよ。これ、90年代から今までの全ての技術ロードマップ、データセット、ツールを網羅してる**オープンソースプロジェクト**で、研究者がこの分野をサクッと理解して始められるようにするのが目的なんだって。このプロジェクトは常に更新されてて、オープンでみんなで作る3D研究コミュニティの構築に力を入れてるから、めっちゃ価値のあるナレッジグラフみたいなリソースだよ。['プロジェクトアドレス'](https://github.com/hzxie/Awesome-3D-Scene-Generation) <br/> [![图片](https://cdnv2.ruguoapp.com/Fsygd9CMpRC3MvQFFsgIv8rIkrhSv3.png)](https://cdnv2.ruguoapp.com/Fsygd9CMpRC3MvQFFsgIv8rIkrhSv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/FtGyFkIx7ohaQLQvISOZ05L-9UHv3.png)](https://cdnv2.ruguoapp.com/FtGyFkIx7ohaQLQvISOZ05L-9UHv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/Fg2BhAs5S1xxTcACmMIULKftS6E-v3.png)](https://cdnv2.ruguoapp.com/Fg2BhAs5S1xxTcACmMIULKftS6E-v3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/FvYQXTDXrQmYHXgKLduO36RCwzqvv3.png)](https://cdnv2.ruguoapp.com/FvYQXTDXrQmYHXgKLduO36RCwzqvv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/FoOAi8t0WRkkUc8hHHQ7bZZjImrAv3.png)](https://cdnv2.ruguoapp.com/FoOAi8t0WRkkUc8hHHQ7bZZjImrAv3.png) <br/> [![图片](https://cdnv2.ruguoapp.com/FrSs5JUXXkMqilJA5YN7CmmemJnRv3.png)](https://cdnv2.ruguoapp.com/FrSs5JUXXkMqilJA5YN7CmmemJnRv3.png) <br/>
5. Simonの白昼夢が**MCP-Zero**プロジェクトをシェアしてたよ。これって、**オープンソース**の「ツールチェーン自動構築」っていう方法で、意味の埋め込みと階層的なマッチングを使って、大規模言語モデル(**LLM**)が人の手を借りずに、自分でツールを選んで組み合わせて複雑なタスクをこなせるようにするんだって。このプロジェクトは、次の**AIエージェント**システムの設計において、めちゃくちゃ大事な技術のブロックの一つになるって期待されてるんだ。['プロジェクトアドレス'](https://github.com/xfey/MCP-Zero) ['論文アドレス'](https://arxiv.org/abs/2506.01056) <br/> [![图片](https://cdnv2.ruguoapp.com/FsDuyhgVGVS_nPGRPn7pc8N5QheVv3.png)](https://cdnv2.ruguoapp.com/FsDuyhgVGVS_nPGRPn7pc8N5QheVv3.png) <br/>
#### **ソーシャルメディアシェア**
1. 帰蔵が予測してるんだけど、新しい、バズりそうな**Veo3 ASMR動画カテゴリ**がもうすぐ出てくるらしいんだ。これ、**ASMR配信者**をそのまま真似してて、**人物の語り**と**物の操作音**を組み合わせたもので、詳しい**プロンプトテンプレート**も提供してるって。**人の声**と**小道具の音響効果**を組み合わせたこの新しい形は、今いる**ASMR配信者**に影響を与えるかもしれないし、**AI生成動画**でのコンテンツ制作の新しいトレンドを示すものだね。['もっと詳しく'](https://m.okjike.com/originalPosts/685228962d05f8d12ae502df)
<video src="https://videocdnv2.ruguoapp.com/lkrK1NoiIWpcYNr3SsJuuHkKuDDS.mp4?sign=e1a65d27d0905ad88797542dde43534e&t=6852a9e5" controls="controls" width="100%"></video>
---
#### **音声版を聴く**
| 🎙️ **小宇宙** | 📹 **抖音** |
| --- | --- |
| [来生小酒館](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情報局](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
| ![小酒馆](https://s1.imagehub.cc/images/2025/06/24/f959f7984e9163fc50d3941d79a7f262.md.png) | ![情报站](https://s1.imagehub.cc/images/2025/06/24/7fc30805eeb831e1e2baa3a240683ca3.md.png) |