AI情报局接获线报,据OpenAI内部消息,GPT-5最快将于3个月后发布,因为OpenAI需要3个月邀请各领域的专家来做内容安全审核,比如医疗领域需要邀请专业的医生进行审核。AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。
莱芒生物完成5000万元新增融资:莱芒生物基于免疫代谢重编程+前沿人工智能的创新技术,专注于研发、生产和商业化新型肿瘤免疫治疗药物。本次融资的新股东有富汇创投、云帆科技投资以及私人财务投资者,同时原有老股东天图投资、晶泰科技持续加持。中艾云完成数百万元天使轮融资:中艾云是一家智能艾灸服务机器人研发商,主要经营研发艾灸智能机器人,艾灸治疗仪等。资方为苏州高铁新城旗下国控基金鑫诚创投与全国减肥连锁品牌歌曼丽产业基金。英特尔入股立讯精密:立讯精密旗下东莞立讯技术有限公司发生工商变更,股东新增英特尔(中国)有限公司,同时,注册资本由约5.71亿人民币增至约5.89亿人民币。英特尔对立讯技术的战略投资,有助于立讯打开北美AI服务器市场。(欢迎添加微信AIyanxishe2,了解更多AIGC、融资情况,与志同道合的朋友一同畅聊时新AI产品)
潞晨Open-Sora技术路线公开,一键生成16秒720p视频:潞晨 Open-Sora 自发布以来热度不减,GitHub 上揽星已达 17.5K。16秒720p高清画质一键生成,人物渲染逼真到爆,电影级变焦。在公布模型权重和训练细节后,潞晨 Open-Sora 仍在持续开源中。最近,其幕后团队在 GitHub 上晒出了技术路线,进一步披露了最新版本模型的训练核心内容。Lambda Labs 还基于其模型权重打造了数字乐高宇宙。DeepSeek Coder V2开源发布,首超GPT4-Turbo的代码能力:全球首个在代码、数学能力上与GPT-4-Turbo争锋的模型,DeepSeek-Coder-V2,正式上线和开源。DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型结构,总参数 236B,激活 21B,在代码、数学的多个榜单上位居全球第二,介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。该大模型将展示人工智能技术与养老服务场景的深度融合成果,是北京在促进降本增效、优化服务体验、释放智能化潜能等方面的创新实践。精准预测武汉房价!浙大GIS实验室提出osp-GNNWR模型:该模型通过引入优化的空间邻近性度量,结合地理神经网络加权回归方法,有效地提升了模型对房价预测的准确性。研究通过模拟数据集和武汉市实际房价数据进行了验证,结果表明 osp-GNNWR 模型在全局性能上优于传统的 OLS、GWR 和 GNNWR 模型。该研究为房地产市场内复杂空间关系的建模提供了新的途径,并可能推动深度学习技术在房价预测等领域的应用。金山办公 WPS AI 海外版发布,海外月活设备数已超两亿:WPS AI锚定 AIGC、Copilot、Insight三方面。基于 Amazon Bedrock 支持的 AnthropicClaude 3 系列模型,WPS AI 可为用户提供包括语义检查、内容改写、文档润色和一键生成 PPT 等功能。自 WPS AI 海外版开启测试以来,以 AI 驱动的海外产品月活设备数已超两亿。中国科大人形机器人研究院揭牌,并宣布长三角人形机器人联盟成立:中国科学院院士丁汉受聘为人形机器人研究院科技委员会主任。研究院将在材料传感、结构驱动、运动控制以及具身智能等方向争取技术突破。积极推进人形机器人在服务、医疗、教育等领域的应用,并将通过与企业的合作,加快科研成果的产业化进程。李彦宏称智能体是AI时代的网站,将形成数百万量级生态:李彦宏分析,智能体就像互联网时代的网站,门槛足够低,“当时看网站是怎么做出来的?通过浏览器一看源代码,非常简单,稍微改一点,我也可以做出来,今天做智能体跟这个很类似……起个名字,告诉它回答什么、不回答什么,就做成了。”他指出,智能体将会大量出现、形成生态。“未来,在各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据,做出来这些智能体。”华为盘古大模型5.0、全新小艺将于6月21日发布:预计盘古大模型5.0将带来诸多重磅升级,而全新小艺也将接入盘古大模型5.0,为手机等设备带来更智能的体验。我国“本源悟空”量子计算机全球访问量突破 1000 万:该量子计算机搭载 72 位自主超导量子芯片“悟空芯”,是目前先进的可编程、可交付超导量子计算机。国外访问用户中,美国用户数居于榜首。国家药监局称AI 可用于说明书适老化改造、业务办理及政策咨询等场景:国家药监局印发《药品监管人工智能典型应用场景清单》,推动人工智能技术在药品监管领域的研究探索,清单列出了 15 个应用场景。截至周二(6月18日)美股收盘,英伟达股价上涨3.51%,报135.58美元再刷历史新高,总市值达3.335万亿美元,一举超过了微软和苹果,成为全球最具价值的上市公司。英伟达市值从2万亿美元升到3万亿美元用了96天(日历日)。与之相比,根据Bespoke Investment Group的数据,微软用了945天,苹果则用了1044 天。生成式AI将助力印度打造价值1亿美元的SaaS企业:现有的 SaaS 公司正在转变为以 AI 为核心的实体。First Mark Cap 的 VC Matt Turck 表示,传统和新兴的 SaaS 公司将真正变成以 AI 为中心的企业,AIaaS 将成为新的 SaaS 模式。印度 SaaS 生态系统正在迅速发展,目前,已有11家印度 SaaS 公司的年度营收超过1亿美元。在生成式 AI 技术的支持下,印度 SaaS 公司如 Zoho、Freshworks 和 Yellow.ai 的产品表现出色。阿联酋抢占人工智能高地,迪拜发起"百万提示者"培养计划:该计划将在三年内为 100 万人提供人工智能提示工程训练,这是全球首个如此大规模的培养项目。迪拜正在为后石油时代做准备,目标是成为人工智能强国。阿联酋人工智能国务部长表示,该计划旨在向大众展示人工智能的广泛应用,发展实用的提示工程技能对提高生活质量至关重要。Runway 发布 Gen-3 AI 视频生成器,90 秒生成 10 秒片段:Gen-3在生成速度和保真度方面有了“重大”改进,能让用户实现高质量视频创作,可调整视频输出,使创作过程更直观和易于操作。对生成视频的结构、风格和运动提供了细粒度的控制。Gen-3 将在未来几天内向 Runway 订阅用户提供,包括企业客户和 Runway 创意合作伙伴计划中的创作者。Runway 联合创始人表示,Gen-3 的视频生成时间明显快于 Gen-2。生成一个 5 秒的片段需要 45 秒,生成一个 10 秒的片段需要 90 秒。Luma AI发布Extend功能,视频时长扩充到10秒以上:只要在视频位置点击“Extend”按钮,继续输入提示词,就能将视频延长5秒,并保持原视频风格、人物对象一致。测试过程中,Extend 功能生成延长视频耗时会比较久,效率变低,不过风格一致性保持得很好。DeepMind 推出 V2A 技术,为视频生成音频:V2A(视频到音频)AI 技术,能为视频自动生成音乐、声效和对话,并与视频完美同步。尽管 AI 生成声音的工具并非首创,DeepMind 声称其 V2A 技术在理解视频原始像素并自动同步生成声音方面是独一无二的。Meta新模型NLLB获Nature盛赞,200种濒危语言高质量翻译:NLLB全称为No Language Left Behind,意为「不让任何一门语言掉队」,是非常有人文关怀的技术描述。这个AI模型能够翻译200种语言,包括资源匮乏的语言。可以免费提供给非商业用途。Nature也对该成果表示称赞。苹果在Hugging Face发布20个Core ML模型:这次更新不仅包括着眼于文本和图像的令人振奋的新模型,还涵盖了广泛的应用,如图像分类、单目深度估计和语义分割。苹果强调了设备AI的重要性,通过在用户设备上运行优化的模型,提升了应用程序性能,同时保障用户数据安全和隐私。ElevenLabs涉足视频生成领域,开源了一个项目可以自动为上传的视频配音,生成合适的音效。他们推出了新功能,用户可以通过输入文本生成各种逼真的音乐特效,为电影、游戏、短视频等行业带来巨大帮助。除音效生成外,还提供语音克隆和文本转语音等强大功能。Stability AI的SD3因许可问题遭反对,CivitAI社区封禁相关内容:Stability AI 推出了一种面向消费者的 “创作者许可”,只适用于年收入不到100万美元、机构资金不到100万美元和月活跃用户不到100万的开发者。许可还限制了每月生成的图像数量为6000张。任何需要超出这些限制的人必须支付企业许可费用。Adobe Acrobat迎来重大AI升级,支持多文档分析和图像生成:用户现在可以将Word、PPT等多种格式文件拖拽至助手界面,AI将自动分析并综合多文档内容,回答用户的提问或识别整体趋势。Acrobat还新增了AI图像生成器。用户能够基于提示词生成全新图像,或对现有PDF中的图像进行删除背景、微调编辑等操作。Adobe强调其AI生成内容"对工作是安全的",不会损害隐私或产生影响品牌形象的结果。英国萨里大学和斯坦福大学的研究团队教会AI理解人类线描草图,即使是非艺术家绘制的。该模型在识别场景草图方面接近人类水平,能够以 85% 的准确率识别和标记对象。科罗拉多初创公司 Enveda Biosciences 利用 AI 发现隐藏在自然环境中的潜在救命化合物,建立了包含 38,000 种药用化合物的数据库。通过 AI 模型,Enveda 能隔离最佳研究候选物,并预测它们可能治疗的疾病。目前,微软和自然保护协会已投资 5500 万美元支持该项目,两种药物将于今年晚些时候进入临床试验,未来有望治疗皮肤病和胃病。麻省理工开发AI「时光机器」,穿越未来和60岁自己对话:麻省理工学院开发了一款名为 “Future You” 的 AI 聊天机器人,它利用 GPT-3.5 和 StyleCLIP 技术,为用户创建未来故事并模拟其 60 岁时的外观。用户可与 AI 生成的虚拟未来自我进行对话,帮助他们审视现在、规划人生。实验显示,这种互动干预方法可增强未来自我连续性,从而减少负面情绪和焦虑,提升动力感和对未来的认知。Canalys 预计今年全球 AI 手机市场份额达 16%,2028 年将过半:根据 Canalys 对具有生成式 AI 能力智能手机市场的调研预测,2024 年,AI 手机出货量预计占全球智能手机出货量的 16%,到 2028 年,这一比例将激增至 54%。从 2023 年到 2028 年,AI 手机市场年均复合增长率(CAGR)将达到 63%。吴恩达对拟定的 SB-1047 法案发表深度长文回应,指出该法案存在问题,如危险范畴定义不合理、对造成的伤害定义不明确等,提出应监管 AI 应用程序而非大模型本身。图灵奖获得者 Yann LeCun 直言该法案将终结加州科技产业,知名架构师 Daniel Jeffries 也呼吁加州议会对该法案投反对票。AI 教父 Hinton支持超级 AI 取代人类:Hinton表示人们不喜欢被取代,「目前我们还不清楚什么是最好的智能形式。显然,从人的角度来看,一切都与人有关。但未来有一天,我们可能会把『人文主义』看成一种类似于种族主义的概念。」据谷歌 DeepMind 新闻稿,DeepMind 近日公布了一项利用 AI 为无声视频生成背景音乐的“video-to-audio”技术。当前 DeepMind 这款 AI 模型依然存在局限性,需要开发者使用提示词为模型预先“介绍”视频可能的声音,暂时不能直接根据视频画面添加具体音效。TikTok将为品牌内容和广告提供包括创作者和演员的AI头像和配音:创作者可以控制是否使用自己的肖像,还能决定自己的费率、授权和头像使用对象。高通被曝开发低成本骁龙 WoA 芯片,AI 算力 40 TOPS:郭明錤称高通计划 2025 年Q4推出用于主流机型(售价 599-799 美元)的低成本 WoA 处理器,代号为 Canim。该处理器采用台积电 N4 工艺,预估 AI 算力达到 40 TOPS。AI 搜索引擎 Perplexity 的最新更新:Perplexity 现在可以直接展示天气信息、货币兑换和简单数学问题的答案,无需用户跳转到其他页面。其CEO表示,这些基本查询现在应该能在搜索引擎上快速完成,并增加了视觉效果使结果更突出。Perplexity 与 AI 搜索引擎 Tako 合作:可视化展示股票价格等信息。AI 助力下,仅用 3个月开发新型无稀土永磁材料 MagNex:英国Materials Nexus 在 MagNex 开发伊始采用 AI 平台对超一亿种不含稀土元素的永磁体成分进行确认和分析,缩短了整体开发流程。IMF称对人工智能造成大规模失业、不平等加剧的可能性深感担忧:国际货币基金组织表示,生成式人工智能具有巨大的潜力,能够促进生产力增长和推进公共服务的可及性。但该组织也警告称,这种技术引发了有关“大规模失业和不平等问题不断加剧”的深刻担忧。戴尔创始人称人工智能发展速度比互联网快10倍:他表示“当我想到互联网时,回到20世纪90年代中期,人工智能有点像那种感觉,只是它发生的速度可能快了10倍。因为现在有50亿人几乎可以立即接触到人工智能。”德国机器人产业面临中国厂商激烈竞争,销售前景承压:德国机械工程行业协会将该行业今年的销售预期下调了一半,并表示,许多中国供应商已经在国内市场站稳脚跟,并正积极进军欧洲市场
Product Hunt 热榜,简化初创企业的资金筹集Unicorns Club
Unicorns Club 是一个专为初创企业和投资者设计的在线平台,简化了资金筹集过程,建立起创业者与投资者之间的关系。平台功能包括:
吸引投资者:帮助创业者创建有吸引力的投资者资料,保持可见性,并定期更新。投资者工具:提供全球最大的初创企业数据库,智能搜索和推荐系统,以及顶级投资者的信息。平台旨在解决传统筹资的复杂性,让创业者专注于产品开发和销售,同时建立关系和信任。无论是 Pre-Seed、Seed 还是 Growth 阶段的创业者,Unicorns Club 都提供了适合各阶段的支持和工具。🔗https://www.unicorns.club/GitHub Trending 热榜,多语言视觉文本渲染的新标杆Glyph-ByT5-v2
由微软亚洲研究院和清华大学等机构的研究人员共同开发,Glyph-ByT5-v2 是一个多语言视觉文本渲染的强大模型,支持 10 种语言,并在视觉美学上取得了显著提升。该模型通过以下几项关键贡献实现了突破:
多语言支持:覆盖 9 种其他语言,突破了原始模型仅支持英语的限制。视觉美学:采用最新的步骤感知偏好学习方法,提高了视觉美感。数据集和基准:构建了高质量的数据集,包含超过 100 万个字形文本对和 1000 万个图形设计图像文本对,并创建了多语言视觉段落基准。🔗https://glyph-byt5-v2.github.io/1."steven-tey/novel" 类似 Notion 的 WYSIWYG 文本编辑器
"steven-tey/novel" 是一个开源项目,提供了一个 Notion 风格的所见即所得(WYSIWYG)文本编辑器,它的主要特点是集成了人工智能自动补全功能,可以预测并建议用户输入的文本,提升用户体验。该编辑器使用了一系列现代技术栈,包括使用 Next.js 作为框架,Tiptap 用于实现 WYSIWYG 功能,OpenAI 提供 AI 自动补全服务,Vercel AI SDK 用于集成 AI 功能,Vercel 用于部署应用,TailwindCSS 用于样式设计,以及 Cal Sans 作为编辑器字体。项目支持本地设置和部署到 Vercel,并且有社区为其他框架如 Svelte 和 Vue 提供了维护包,同时还有一个 VSCode 扩展。2.AI Math Notes:交互式绘图与计算的完美结合
AI Math Notes 是一个开源项目,提供了一个基于 Python 的交互式绘图应用程序。用户可以在画布上绘制数学方程式,通过多模态大型语言模型计算并显示结果。应用程序使用 Tkinter 库创建图形用户界面,并利用 PIL 进行图像处理。灵感来自苹果公司在 WWDC 2024 上展示的 "Math Notes" 演示。用户绘制等号后点击计算按钮,应用程序会计算结果并以橙色显示在等号旁边。AI Math Notes 的核心功能是将用户绘制的数学方程式转换为计算结果,并在画布上展示。用户界面简单直观,包括黑色背景的画布、白色绘制颜色、清除按钮、撤销按钮和计算按钮。未来,项目计划实现自动检测等号的功能,以提升用户体验和计算准确性。项目鼓励社区的参与和贡献,期待通过开源精神推动技术进步。🔗https://github.com/ayushpai/AI-Math-Notes3.Wunjo:一站式视频和音频编辑工具平台
Wunjo 网站展示了一系列多媒体编辑技术,用户可以学习如何使用这些工具来实现各种编辑效果。例如,使用一张照片进行面部交换、同步视频中的口型与音频、提升低分辨率内容的质量、移除物体和背景、改变内容风格、克隆声音以及分离歌声与背景音乐。此外,网站还提供了一些其他辅助学习和工作的工具。🔗https://wunjo.online/demo4.Rebind:与 AI 一起阅读经典文学
Rebind 提供了一种全新的阅读体验,涵盖詹姆斯・乔伊斯的《都柏林人》和约瑟夫・康拉德的《黑暗的心脏》等经典书籍。每本书都由知名作家或思想家进行重新解读。用户可以通过视频内容、高亮、反应和笔记来积极参与,并与 AI 模型讨论书中的关键时刻。Rebind 的目标是通过深度阅读、提问和写作,帮助用户与书籍建立深刻联系,在生活中留下持久印记。未来几年,Rebind 还计划增加更多的书籍和虚拟专家。IOC 计划部署一款 AI 工具,能够识别并删除超过 35 种语言的辱骂性帖子,保护 15,000 名运动员和组织者免受骚扰。该计划还将帮助研究人员了解问题的普遍性以及侮辱性言论对运动员心理健康的影响。这是首次使用 AI 保护如此多的运动员。
虽然计划很有前景,但有些人担心 IOC 是否能超越社交媒体平台的政策。一些隐私专家担心这样的举动可能侵犯隐私权。奥运会组织者表示,他们的担忧是有理由的。月初,微软发布报告称,俄罗斯特工制作了虚假的纪录片来抹黑奥委会,并生成了虚假的威胁性涂鸦图像,试图恐吓参加者。
@aiexplained-official 运营,拥有 263K 订阅,在视频中指出LLMs 的局限性:视频通过一个图形推理挑战展示了 GPT-4 在处理未遇到的问题时的不足,强调了当前大型语言模型在抽象推理和一般智能方面的局限性。尽管这些模型在许多任务中表现出色,但在遇到全新问题时,它们的推理能力显得不足。
AI 领域的挑战:视频指出了 AI 领域存在的一些问题,包括过度承诺、市场营销中的夸张、隐私侵犯和 AI 生成内容泛滥等。此外,视频还提到了 AI 在药物预测和医疗领域(如脑卒中预测系统)的应用,展示了其巨大潜力,但这些成就往往被简化为 "AI" 一词,而忽视了底层的技术细节。迈向 AGI 的六种方法:视频提出了六种可能的方法来提升 LLMs 的性能,包括改进推理能力、使用验证器和蒙特卡洛树搜索来提高数学推理能力、多示例学习、测试时微调、与符号系统结合使用、以及捕捉人类专家的隐性知识。视频总结道,AI 的发展不会突然爆发,而是通过多种方法的结合,逐步朝着人工通用智能迈进。🔗 https://www.youtube.com/watch?v=PeSNEXKxarU
CCF学科前沿讲习班「具身智能」,将系统地讨论具身智能的内涵与外延,并结合形态智能、感知与学习等多视角探讨包括环境导航、机器人操作等典型具身行为的前沿智能方法。经过本次讲习班的研习,能够系统地了解具身智能的体系结构、前沿技术、主要挑战和应用场景,开阔科研视野,增强思考与实践能力。讲习班邀请了10位来自著名高校与企业科研机构,活跃在前沿领域的专家学者做主题报告。第一天聚焦具身导航与操作。第二天聚焦通用具身智能。第三天介绍三维世界中的通用具身智能体。下午讲授具身智能的应用。同时讲习班将同期在会场为参会者设立Poster展示环节,促进交流。通过三天的学习,加强学员对具身智能的关键技术与产业应用等领域的深刻理解。🔗 https://mp.weixin.qq.com/s/POXplm5JsBtlV9Oa1cna8g敬请期待明日的最新动态!
AI情报局征集情报合伙人,汇集独家价值线索!如果您可以提供有关AI最新成果&行业内幕&独特产品,请添加运营微信号:AIyanxishe2备注行业岗位。更多内容,点击下方关注: