93 lines
19 KiB
Markdown
93 lines
19 KiB
Markdown
---
|
||
linkTitle: 07-09-日报
|
||
title: 07-09-日报 AI 资讯日报
|
||
weight: 22
|
||
breadcrumbs: false
|
||
comments: true
|
||
description: 生数科技が、世界中をアッと言わせるVidu Q1 ビデオモデルの参照生成機能 を発表したんだって!これはスゴいよ。ユーザーは参考画像をアップロードするだけで、たった数分で複数の要素を融合した動画素材を自動生成できちゃうから、制作プロセスがめちゃくちゃ楽になるんだよね。ビジネスで使う時も、最大
|
||
7つの主体 まで入力.
|
||
---
|
||
## AIインサイト日報 2025/7/9
|
||
|
||
> `AI日報` | `朝8時更新` | `全ネットワークデータ統合` | `最先端科学探求` | `業界からの自由な発信` | `オープンソースの革新力` | `AIと人類の未来` | [ウェブ版にアクセス](https://ai.hubtoday.app/)
|
||
|
||
### **AIコンテンツ概要**
|
||
|
||
```
|
||
生数科技はVidu Q1ビデオモデルをリリース。参照生成と高画質制作に対応してるよ!
|
||
釘釘がAIスプレッドシートをローンチ!これで企業のデータ処理と自動化効率がグンとアップするね。
|
||
Appleは視覚障害者向けナビ支援のSceneScoutを開発したんだって。それから、上海はAI産業を促進するための新しい政策を発表したよ!
|
||
```
|
||
|
||
### AI製品と機能アップデート
|
||
1. 生数科技が、世界中をアッと言わせる**Vidu Q1** ビデオモデルの**参照生成機能** を発表したんだって!これはスゴいよ。ユーザーは参考画像をアップロードするだけで、たった数分で複数の要素を融合した動画素材を自動生成できちゃうから、制作プロセスがめちゃくちゃ楽になるんだよね。ビジネスで使う時も、最大 **7つの主体** まで入力できて高い一貫性を保てるし、映画みたいな **1080P** の超高画質と **AIサウンドエフェクト** も実現!さらに、従来の素材制作コストをほんの少しにまで抑えられるから、動画コンテンツ制作の効率と柔軟性が爆上がりする、まさに革命的な機能だよ!🎬✨
|
||
<br/>  <br/>
|
||
|
||
2. 釘釘が、ついに **AIスプレッドシート** 製品を公式発表したんだ!「**スプレッドシートがそのままドキュメントになる**」っていう革新的な機能で、企業のデータ処理と情報管理を完全に再定義しちゃったよ。これ、**スマートなフィールド処理**、**データ分析のハードルゼロ**、**自動化されたプロセス作成** っていう超強力な能力を実現してるの 💪。企業が自分だけの業務システムを簡単に構築して、オフィス効率を大幅にアップさせられるから、ビジネスを **AIドリブン** な新しい時代に持っていくのにピッタリだね!📈
|
||
|
||
3. Apple とコロンビア大学が、最近協力して **SceneScout** っていう**AIプロトタイプシステム** を開発したんだって!これ、**Appleマップ** のAPIと**マルチモーダルな大規模言語モデル** を組み合わせて、**視覚障害者や弱視の人たち** に、今までにない街中のナビゲーション支援を提供するのが狙いなんだ。このシステム、**ルートプレビュー** や **仮想探索** 機能があるだけでなく、テストではなんと**AIが生成した説明の72%が正確**だったらしく、ユーザーからもめちゃくちゃ評価が高いんだよ。外出がぐんと便利になること間違いなしだね!🚶♀️🗺️
|
||
<br/>  <br/>
|
||
|
||
4. Microsoft Windows 11 システムに、ついに待望の **AIダイナミック壁紙機能** が登場するみたい!その関連コードは最新のプレビュー版にこっそり現れてるんだけど、まだ使えるようにはなってないんだ。この機能があれば、ユーザーはテーマを選ぶだけで壁紙が自動で更新されるようになるから、Windows 11 がもっと**自分らしく**て**賢い**デスクトップ体験を提供してくれるってワケ。これって、めちゃくちゃカッコよくない?!🤩
|
||
<br/>  <br/>
|
||
|
||
5. Microsoft が、Azure AI Foundry で **Deep Research** の公開プレビュー版をリリースしたんだって!これ、超パワフルな**AIエージェント**で、複雑な**研究や分析**のタスクを自動でこなしてくれるの。**Bing検索**とOpenAIの**GPTシリーズモデル**を賢く組み合わせて、問題をバシッと分解して正確な情報をゲットするから、研究もビジネスの意思決定も効率が爆上がりするよ!API連携もできるから、キミの研究仕事がめちゃくちゃ捗ること間違いなしだね!🚀 [詳細はこちら](https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUQ1VGQUEzRlBIMVU2UFlHSFpSNkpOR0paRSQlQCN0PWcu)。
|
||
<br/>  <br/>
|
||
|
||
### AI最先端研究
|
||
1. アリババグループが、最新の**マルチモーダル大規模言語モデルHumanOmniV2** をドカンと発表したんだ!このモデル、スゴいのが**全体的な文脈理解**と**マルチモーダル推論能力**がバツグンだってことで、AI界隈でめちゃくちゃ注目されてるんだよね。アリババが自社開発したIntentBenchテストでは、**69.33%** っていう驚きの正解率を出したし、独自の「強制的な文脈要約メカニズム」で、従来のモデルが複雑なタスクで陥りがちだった「近道問題」をバッチリ解決してるの。これって、コンシューマー向けも企業向けも、AIアプリでめちゃくちゃ将来性があるってことだよね!🚀🤖
|
||
<br/>  <br/>
|
||
<br/>  <br/>
|
||
|
||
2. カーネギーメロン大学と Cartesia AI の研究者たちが、マジで驚きの秘密を発見したんだって!なんと、たった**500ステップのトレーニング**で、**リカレントモデル**が**256kシーケンス**っていう超長いデータを処理できる、驚異的な**汎化能力**を手に入れたんだって!これは、長〜いシーケンスのタスクにおけるリカレントモデルの限界を完全にぶち破る大発見だよね 🤯。彼らはこの現象を説明するために、「**未探索状態仮説**」っていうのも提唱してるんだ。この研究のおかげで、リカレントモデルの性能と安定性がめちゃくちゃ上がって、ディープラーニングの世界に新しい道が開かれたってワケ!💡✨
|
||
<br/>  <br/>
|
||
|
||
3. 今回の研究で、**AutoHDR**っていう自動で歴史文書を修復する新しい方法が提案されたんだ!これに合わせて、初の全ページ**歴史文書修復データセット**(FPHDR)も公開されてて、今の修復方法の限界を乗り越えるのが狙いみたい。**AutoHDR**は、歴史家さんの作業フローを真似することで、傷んだ文書の**OCR精度**をめちゃくちゃ上げてくれるんだよね。これで、貴重な文化遺産を人間とAIが協力して直せる新しい道が開かれたってワケ。モデルもデータセットもオープンソースで公開されてるから、もっと詳しく知りたかったら[論文アドレス](https://arxiv.org/abs/2507.05108)と[モデルアドレス](https://github.com/SCUT-DLVCLab/AutoHDR)をチェックしてみてね!📜✨
|
||
|
||
### AI業界の展望と社会への影響
|
||
1. スタートアップ企業の**Lovable**が、革新的な「**AIネイティブ**」な働き方で、たった7ヶ月でなんと年間**8000万ドル**もの売上を達成したんだって!マジで驚きだよね。チームメンバーの半分が**AIネイティブな社員**っていうのが、これまでのテック企業の働き方を完全にひっくり返してるんだ。この働き方のおかげで効率がめちゃくちゃ上がって、アイデアもAIの力を借りてすぐに形にできるようになったみたい。これは、**AIネイティブな社員**の登場が、これからの組織の形や働き方にめちゃくちゃ大きな影響を与えるってことだよね。もしかしたら、いらない仕事とかも出てくるかもって、深く考えさせられちゃうね 🤔🚀
|
||
<br/>  <br/>
|
||
|
||
2. なんと**ChatGPT**が、**Soundslice**っていうサイトが**ASCIIギタータブ譜**のインポートに対応してるって間違ってオススメしちゃったんだって😂。そしたら、たくさんのユーザーがそのサイトに押し寄せちゃって、開発者さんは元々なかったこの機能を急いで作って公開することになっちゃったらしいよ。この「ミス」はネットでめちゃくちゃ話題になったんだけど、意外にも「これって逆に**イノベーションのヒント**になったし、技術の進歩を促したんじゃん?」って言われてて、まさに「災い転じて福となす」って感じだよね!💡🎸
|
||
<br/>  <br/>
|
||
|
||
3. 上海市が最近、17項目もの新しい政策を発表したんだ!これ、市全体の**ソフトウェアと情報サービス産業**をマジで発展させるのが狙いで、質の高い**AIプロジェクト**にはなんと最大**30%の補助金**を出すんだって。**算力クーポン**とかを使って企業のコストを下げて、**大規模モデル**の活用をゴリゴリ推進したり、**AIコード生成**も支援するらしいよ。これでハイエンドな人材を引きつけて、業界全体に新しい活力を注入するつもりなんだね。上海、これは本気出してきてるね!🏙️💰🚀
|
||
<br/>  <br/>
|
||
|
||
### オープンソースTOPプロジェクト
|
||
1. Google がオープンソースで公開した**MCP Toolbox for Databases** っていうツール、マジでスゴいんだよ!これは、**モデルコンテキストプロトコル(MCP)**を使って、**AIエージェント**と**SQLデータベース**の連携を超簡単にして、効率的で安全な統合を実現してくれるの。Pythonコードで10行も書かずにサクッと接続できるし、**接続プール管理**とか**認証**、**スキーマ自己内省**とかのコア機能も全部入ってるから、開発効率が爆上がり!データベース連携の頼れる味方だね!🛠️🌐
|
||
<br/>  <br/>
|
||
|
||
2. プロジェクト「**12-factor-agents**」 (⭐7177) が、生産環境で本当に使える**LLM駆動ソフトウェア**の原則を探求してるって知ってた?これ、高品質な**大規模モデル**アプリを顧客にどう提供するかっていう課題を解決するのが目的なんだ。まさに実践ガイドブックみたいに、開発者がLLMを研究室から現実世界に持っていく手助けをしてくれるってワケ!✨ [プロジェクトアドレス](https://github.com/humanlayer/12-factor-agents)
|
||
|
||
3. **WebAgent** っていうプロジェクトが、通義ラボが作った Web エージェントで、**情報検索** の問題を解決してくれるんだって!これには**WebWalker**、**WebDancer**、**WebSailor**みたいなモジュールも含まれてて、今すでに1935個のスターを獲得してるんだ。このプロジェクトのおかげで、効率的な**情報検索**システムが作れるようになるから、情報の大海原をスイスイ泳ぎ回れるようになるね!🌐🔍 [プロジェクトアドレス](https://github.com/Alibaba-NLP/WebAgent)
|
||
|
||
4. **Hands-On-Large-Language-Models** っていうのは、O'Reillyの『実践大規模言語モデル』っていう本の公式コードリポジトリなんだって!読者が**実際に手を動かして**、**大規模言語モデルを深く理解する**ためのものなんだ。今すでに11333個のスターを獲得してるよ。このプロジェクトは、LLMの**学習と応用**のためのコード例がたっくさん詰まってるから、LLMを学びたい人にはまさに宝の山だね!📚💻 [プロジェクトアドレス](https://github.com/HandsOnLLM/Hands-On-Large-Language-Models)
|
||
|
||
5. **GenAI_Agents** っていうリポジトリには、色々な**生成AIエージェント技術**の**チュートリアルと実装**がぎっしり詰まってるんだ!これ、**賢くて、会話できるAIシステム**を作るための、基礎から応用まで**全部教えてくれる**ガイドみたいなものなんだよ。今すでに13914個のスターを獲得してるの。開発者が**生成AIエージェント**を深く掘り下げて、実際に使うためのめちゃくちゃ貴重な資料だから、君もAIエージェントマスターになれるかも?!🤖✨ [プロジェクトアドレス](https://github.com/NirDiamant/GenAI_Agents)
|
||
|
||
6. 日本のAI企業**Sakana AI**が、**AB-MCTS**っていう画期的なアルゴリズムを発表したんだ!これ、**大規模言語モデル**(ChatGPTとかGemini、DeepSeekとかね)が、まるで人間のチームみたいに協力して問題を解決できるっていうスグレモノなんだよ。**ARC-AGI-2**みたいなベンチマークテストでも、単体モデルより圧倒的に良い成績を出してるんだから驚きだよね。この研究でわかったのは、色々なモデルの良いところを組み合わせると、もっと複雑な課題も効率よく解決できるってこと。このアルゴリズムは**TreeQuest**としてオープンソース化されてて、AIの協調作業に新しい扉を開いてくれたってワケ!🤝✨ [プロジェクトアドレス](https://github.com/SakanaAI/treequest)。
|
||
|
||
### SNSシェア
|
||
1. 宝玉さんがSNSで**AIによるコード生成**の効率問題について、深く掘り下げて議論してたんだ。彼いわく、AIは特定のタスク(例えば**ClaudeCode**が1時間でYouTubeクローラーを完成させるみたいに)では、めちゃくちゃ効率を上げてくれるけど、複雑なコードとか、いわゆる「**クソコード**」みたいなやつだと、AIによる効率アップは限定的で、下手したらもっと複雑なコードを生み出す原因にもなりかねないって。だって、AIって要求をハッキリ理解するのが難しいし、生成されるコードの質も、たまに高い基準に達しないことがあるからね。🤔💬 [詳細はこちら](https://x.com/dotey/status/1942580441367863327)。
|
||
|
||
2. wwwgoubuli さんが言ってたんだけど、実際の多くの場面で、事前にちゃんと組まれた**定性的なワークフロー**の方が、**AIエージェント**よりも便利で使いやすいって。これって、特定のアプリではやっぱり**ワークフローのオーケストレーション**が圧倒的に強いってことだよね。💡🔄 [詳細はこちら](https://x.com/wwwgoubuli/status/1942519738233426360)
|
||
|
||
3. 歸藏(guizang.ai) さんが、「蔵師匠」っていう**プロンプト**で作った高品質な**ロング画像**をシェアしてくれたんだ!この**プロンプト技術**が、ビジュアルコンテンツ制作でどれだけ使えるかっていうのをバッチリ見せつけてくれてて、まさにAIを遊び倒してる感じ!🎨✨ [詳細はこちら](https://x.com/op7418/status/1942430126899163318)
|
||
<br/>  <br/>
|
||
|
||
4. 歸藏(guizang.ai) さんが、ある文章が98回も下線が引かれてたって指摘してたんだけど、これって皆が何か**大きな変化に同意してる**ってことの表れだよね。彼、以前友達と AGI Bar で**AIがコンテンツ作成に与える影響**とか**トラフィックの匂いを嗅ぎ分ける力**をどう育てるかって話してたらしいんだけど、その時の洞察をまとめて公開してて、マジで考えさせられる内容だったよ。✍️📈 [詳細はこちら](https://x.com/op7418/status/1942428799280488582)
|
||
<br/>  <br/>
|
||
<br/>  <br/>
|
||
|
||
5. Elvis さんが、**Gemini CLI** と **MCPサーバー** の組み合わせを大絶賛してたんだ!これ、**プログラミング**の現場でめちゃくちゃ活躍するだけじゃなくて、**文字起こし**とか**文章作成**みたいなクリエイティブな作業でもハンパない実力を見せてくれるんだって。動画もシェアしてくれてるから、その強力な機能をぜひ見てみてね!✨🚀 [詳細はこちら](https://x.com/omarsar0/status/1942418143609033115)
|
||
</video>
|
||
|
||
---
|
||
|
||
## **AI日報の音声版を聴く**
|
||
|
||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||
| --- | --- |
|
||
| [来生小酒場](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [メディアアカウント](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||
|  |  | |