--- title: 06-03-Daily weight: 28 breadcrumbs: false comments: true description: グーグルが先日、アメリカでGemini Live機能を出して、ついにiOSとiPadOSプラットフォームでも使えるようになったんだ。Gemini Appから、AIがシーンとか画面の内容を認識してくれる便利さを無料で試せるよ。これって、ユーザーの体験をアップさせるだけじゃなくて、AI技術がもっと日常に溶け込んで、みんなの賢いアシスタントになっていく予兆だよね。 --- # AIインサイト日報 2025年6月3日 #### **AIプロダクト・機能アップデート** 1. グーグルが先日、アメリカで**Gemini Live**機能を出して、ついに**iOS**と**iPadOS**プラットフォームでも使えるようになったんだ。**Gemini App**から、**AI**がシーンとか画面の内容を認識してくれる便利さを無料で試せるよ。これって、ユーザーの体験をアップさせるだけじゃなくて、**AI**技術がもっと日常に溶け込んで、みんなの賢いアシスタントになっていく予兆だよね。
[![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453725280965957304782.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453725280965957304782.png)
2. マイクロソフトがね、**OpenAI Sora**の技術をベースにした無料の**Bing Video Creator**ツールを新しく出してくれたよ。簡単なテキスト入力だけで、誰でもサクッとショート動画が作れちゃうんだ。このツール、もう世界中のBingモバイルアプリで使えるようになってて、動画作りのハードルがめちゃくちゃ下がったから、ユーザーのクリエイティブな体験がもっと豊かになりそうだね。
[![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453719041406883771175.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453719041406883771175.png)
3. シンガポール国立大学(NUS)のチームがね、最近**OmniConsistency**プロジェクトを発表したんだ。これ、**GPT-4o**の画像スタイル変換の一貫性を、めちゃくちゃ低いコストで再現することに成功して、オープンソースコミュニティのスタイル変換の課題を解決しちゃったんだよね。このプロジェクトは、独自の学習フレームワークとモジュール化されたアーキテクチャで、画像生成分野の超重要なツールになって、**AI**アート制作をガンガン進めてくれるって期待されてるよ。
[![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453880310640421505355.png)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/2025/0603/6388453880310640421505355.png)
#### **AI最先端研究** 1. **WebChoreArena** ([Link](https://arxiv.org/abs/2506.01952)) っていうのが、LLMが動かすウェブブラウジングエージェントが、面倒で複雑なウェブタスクをどれくらいこなせるかを評価するために、532項目も丁寧に選ばれたタスクからなる新しいベンチマークを発表したんだ。研究によると、**GPT-4o**みたいな最先端のデカいモデルも、このベンチマークではすごい進歩を見せたんだけど、一般的なウェブタスクに比べると、まだまだ大きく伸びる余地があるってことが分かって、複雑な**「ウェブ雑務」**を処理することの難しさが浮き彫りになったってわけ。 2. **RoboMaster** ([Link](https://arxiv.org/abs/2506.01943)) はね、革新的なロボット操作動画生成フレームワークを発表したんだ。これは、協調的な軌道モデリングと、インタラクションプロセスを段階的に分解することで、複数のオブジェクトが絡む場面で視覚的なリアリティが落ちちゃう問題をバッチリ解決したんだよ。この技術のおかげで、**ロボット操作**の動画生成クオリティに新しい突破口が開けて、複雑なシーンでの**軌道制御**に、もっと精度の高い解決策を提供できるようになったってわけ。 #### **AI業界の展望と社会への影響** 1. 最近ね、アメリカのユタ州の弁護士リチャード・ベドナーさんが、法廷書類で**ChatGPT**が作ったウソの判例を引用しちゃって、裁判所から罰金くらっちゃったんだって。これまた、法律の世界での**AI**利用について、大きな議論を呼んでるよね。この一件は、法律関係者に対して、新しい技術を使うときは、絶対に厳しく**チェック責任**を果たして、法的な書類の正確さをしっかり確保しなきゃダメだよって、強く警鐘を鳴らしてるってことだね。
[![图片](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202304121052180076_0.jpg)](https://autoproxy.justlikemaki.vip/?pp=https://pic.chinaz.com/picmap/202304121052180076_0.jpg)
2. **OpenAI**が2025年の前半に、**ChatGPT**を**T字型スキル**を持った「**スーパーアシスタント**」にする計画だってさ。これはAppleの**Siri**の牙城を崩しにかかる狙いなんだって。この戦略文書から分かったのは、**OpenAI**は**ChatGPT**を日常のちょっとしたことや複雑な作業までこなせる賢い相棒にしたいだけじゃなくて、ユーザーがどのプラットフォームでも、デフォルトの**AI**アシスタントを自由に選べるようにしようぜって呼びかけて、**AI**市場をもっとオープンにしようとしてるってことだよ。 #### **オープンソースTOPプロジェクト** 1. **nautilus_trader** ([Link](https://github.com/nautechsystems/nautilus_trader)) は、6728も**Star**が付いてる**高性能アルゴリズム取引プラットフォーム**で、**イベント駆動型バックテスター**でもあるんだ。開発者には、めちゃくちゃ強力な取引戦略の検証能力を提供してくれるよ。 2. **data-engineer-handbook** ([Link](https://github.com/DataExpert-io/data-engineer-handbook)) は、なんと28669もの**Star**が付いてるんだよ!ユーザーが**データエンジニアリング**を学ぶのに役立つ、関連する学習リンクが全部まとまってる総合的なリソース倉庫なんだ。 3. **postiz-app** ([Link](https://github.com/gitroomhq/postiz-app)) は、20460もの**Star**をゲットしてる**究極のソーシャルメディアスケジュール管理ツール**なんだよ。たくさんの**AI**機能が組み込まれてて、ソーシャルメディアの管理をめちゃくちゃ楽にしてくれるってわけ。 --- #### **音声版を聴く** | 🎙️ **小宇宙** | 📹 **抖音** | | --- | --- | | [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [来生情报站](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)| | ![小酒馆](https://s1.imagehub.cc/images/2025/06/24/f959f7984e9163fc50d3941d79a7f262.md.png) | ![情报站](https://s1.imagehub.cc/images/2025/06/24/7fc30805eeb831e1e2baa3a240683ca3.md.png) |