大神卡帕西墙裂推选!天天影视播放器
甚而预言这个AI 哄骗,有可能开启「和 ChatGPT 相同大的契机」。
它便是来自谷歌的实验性 AI 居品,Notebook LM,背后由谷歌当今最宽绰的模子 Gemini 1.5 Pro 提供撑合手。
最近这哄骗要多火就有多火,全因上线了一项新功能——
上传文献(翰墨、音频、视频),AI 不仅能帮手用翰墨提取要点,还不错通过音频综合(Audio Overview)功能,把文献改革成 AI 生成的对话播客,字据文档实践进行研究。
2 个 AI,用真东谈主般的语音和口气,围绕文献实践表情研究,终末回来陈词。
△卡帕西输入训诲 GPT-2 的 C 代码,制作的对话播客
这确切很酷!
而且不是卡帕西一个东谈主在夸。逛了下互联网几大平台,网友们对 Notebook LM 大都如故挺买账的。
AI 界的 KOL@elvis 也在卡帕西挑剔区留言:
卡神称这"让东谈主思起 ChatGPT 时刻",皆备不是过甚其辞!
真实让多种模子齐集责任,会解锁 Notebook LM 这样特有的实践形状和用户体验。
Notebook LM 怎么玩?
玩法很浅易,大开试玩页面,拖拽上传需要措置的文献。
不错是谷歌文档,不错是网站和视频连结,甚而干脆粘贴一大段文本都不错。
每个札记本撑合手上传 50 个文献,每个文献实践上限 500000 个单词。
这里咱们上传了 OpenAI o1 的 System Card 文档,接下来就不错采选需要创建的实践。
内置撑合手问答、小磨砺、目次、时候线、纲目等翰墨版功能,以及两个主合手东谈主的深度对话音频实践。
要是有更个性化的需求也不错我方敲 prompt。
咱们尝试用汉文发问,成果 AI 是不错清醒的。
很可惜的是 Notebook LM不撑合手用汉文回话,即使刻意条目也不成。
采选创建音频的话,视文档长度需要恭候几分钟到十几分钟。
趁这个时候来了解一下这背后的 Gemini 模子叭~
NotebookLM 由 Gemini 1.5 Pro 来撑合手,也便是谷歌家现时旗舰级大模子。
Gemini 1.5 Pro 撑合手超长 128k 高下文天天影视播放器,这是能解读长文档的基础。
好了,刚才生成的音频也措置完了,英语好的一又友不错来听听看。
英语没那么好的一又友,也不错望望套娃 AI 转写、翻译出来的 AI 播客翰墨版,感受一下。
单纯的上传文档,生成实践,还仅仅 Notebook 的实用玩法之一。
还有东谈主先容了学生上课灌音,回家用 AI 整理要点的玩法,也广受好评。
(不是我方不听课了的道理)
具体来说,不错遵从以下形状:、
上课时用手机灌音;
上课工夫不需要用电脑,只需(纸笔)记下简约的要点;
(下课后)把灌音和札记扫描上传到 NotebookLM,让它字据灌音细节扩写札记。
另外,还不错每周创建一份对所学实践要点的温习音频。
一种与单纯 Chat 不同的交互范式
其实,NotebookLM 并不是出谈即爆火。
早在前年 5 月的 Google I/O 大会上它就也曾出现了,不外阿谁时候,行为 AI 札记本神色的它还叫Project Tailwind。
到了前年 7 月,NotebookLM 它才改成当今的名字。
开端,只撑合手好意思国局部地区的用户食用;功能也如故围绕着基础的 Chat 模式张开。
△NotebookLM 自动生成文档指南(来自谷歌官网)
到了这个月 11 号,NotebookLM 倏得通告面向全球玩家通达,况兼新增了重磅功能,音频综合。
谷歌给的官方先容是这样的:
"新的音频综合功能,不错一键将文档、幻灯片、图表等转换为悠悠忘返的研究。"
因为交互形势很新、AI 语音传神、研究起来确切很像真东谈主播客,世界一下就玩嗨了。
到这两天,Notebook LM 不仅也曾约略把 Youtube 视频行为输入,还也曾撑合手超 100 种谈话。
当今,卡帕西的下场"示爱",更为 Notebook LM 的热度添了一把火。
如卡帕西所说,Notebook LM 爆火最主要的原因,是它提供了一种与单纯 Chat 不同的交互范式。
卡帕西默示,Notebook LM 根除了大模子的两大享受迫害:
第少许,聊天其实挺难的。
有些东谈主在日常生计中跟东谈主疏通都用度心力,更别提要和 Chatbot 聊天,还得不休发问、追问。
NotebookLM 好就好在,生成的二 AI 播客,其中有一方就会处于发问、提醒扮装。
原味咱把文档、音视频放进去,恭候生成,好意思好意思听 AI 字据文献唠便是了。
第二点,阅读不是件容易的事。
信息爆炸的碎屑化期间,挑个舒心的姿势,或者开车时候听别东谈主研究我需要的东西,比我方辛苦吧啦搁那处看容易得多。
——哪怕看的是 AI 也曾帮咱们回来出来的凝练版块(哎,没错,咱便是这样懒!doge)。
本着诚心诚意的精神,也有网友默示了对 Notebook LM 更进一竿的期待。
Hyperbolic Labs 的联创兼 CTO Yuchen Jin 试玩事后,回来了两个局限性:
一个是它"看不到",也便是没法措置文档里的图片信息。
不外背后的 Gemini 是多模态的嘛,比较 Notebook LM 长眼睛不会太晚。
另一个是用户无法提醒 AI 播客的实践。
Yuchen Jin 喂给它两条推文,它就生成了近 13 分钟的音频实践,但它默许听众是平日受众,是以讲了许多很基本的主见。
要是能指定生成播客的计算群体,或者商量主题、标的、角度,那确切是棒上加棒。
One More Thing
说时迟当时快,建树者搞出开源版的 NotebookLM了!
不外暂时只可喂给它 PDF 嗷。
咱便是说,东谈主类真有道理哈!
过去在音频转翰墨方面辛苦,追求把播送、会议灌音啥的转成翰墨。
当今又驱动用大模子把翰墨转成播客了……
有道理哇有道理哇(狗头)。
参考连结:
[ 1 ] https://notebooklm.google/
[ 2 ] https://x.com/karpathy/status/1840112692910272898
[ 3 ] https://x.com/omarsar0/status/1840145774874898506
[ 4 ] https://x.com/Yuchenj_UW/status/1840203324571943403
[ 5 ] https://github.com/gabrielchua/open-notebooklm天天影视播放器