Bendi新闻
>
七年磨一剑,星爵要让Zilliz成为向量数据库领域最亮的那颗星 | 助力中小企业AI化系列访谈
七年磨一剑,星爵要让Zilliz成为向量数据库领域最亮的那颗星 | 助力中小企业AI化系列访谈
7月前
导语:3月28日,创业黑马集团在2024黑马AI培训战略发布会上,董事长牛文文表示黑马致力于成为面向千行百业中小企业的AI应用推广和服务平台,希望AI产业专家、产业龙头、产业投资机构和产业新锐企业,一起携手助力中国中小企业AI化,一起推动中国AI产业的创新发展。
i黑马作为创业黑马集团旗下的核心媒体平台,推出“助力中小企业AI化”栏目,挖掘并报道AI产业中能助力中小企业AI化的企业或机构,促进他们与中小企业之间更好的联动与合作。
刚刚结束的英伟达GTC大会,堪称“AI界的春晚”,除了黄仁勋发布的Blackwell芯片和机器人等新品以及未来对NIM软件服务平台的投入,让人备受瞩目,还有另外一家中国AI企业荣耀绽放,那就是向量数据库头部企业Zilliz.创始人星爵,携合伙人及研发VP栾小凡、AI和机器学习负责人Frank Liu ,集体亮相GTC大会,在不同的活动环节进行主题演讲,让全球AI从业者牢牢记住了Zilliz这家公司的名字。
那,什么是向量?什么是向量数据库?在哪些场景中应用?对于企业AI化有什么价值?Zilliz又是凭什么获得英伟达如此高的重视度?带着这些疑问,我们趁创始人星爵回国的空档,进行了一次简短的交流。
以下内容是访谈精选,用一杯咖啡的时间,品一下。
向量是由机器学习模型所产生的一种高维数据的表示,被用来表达各种非结构化数据的语义。星爵看到全球80%的数据都是非结构化数据,这是一个具有无限想象空间的市场。于是在2017年毅然辞去美国Oracle公司云数据库创始工程师的高阶职位,回国创办了Zilliz,并在2018年推出了Milvus向量数据库服务产品,7年的创新与坚持,Zilliz已然成长为向量数据库领域的头部公司,也获得到了英伟达的青睐与合作。
早在2018年,星爵就看到了AI里面的三支柱:算法、算力和数据,并预见到非结构化数据领域的巨大机会。
在过去几十年的 IT 时代,我们见证了关系型数据库和结构化数据处理的兴盛和繁荣。结构化数据指的是按照固定格式或模式组织的数据,这使得它易于被计算机系统和应用程序存取、查询和分析。这种数据通常存储在关系数据库中,如SQL数据库,其中的数据被安排在表格中,表格有明确的行和列。每列都有一个预定义的数据类型,如整数、浮点数、字符串等。例如,一个公司员工的数据库可能包含多个表格,如员工信息表,其中包括员工编号、姓名、职位、部门等列。这种结构使得可以很容易地执行如搜索特定员工、列出某个部门所有员工等操作。
在 AI 时代,数据处理的类型发生了变化,从结构化变成了非结构化。非结构化数据指的是没有预定义数据模型或不容易适应传统数据表格结构的数据。这类数据包括文本文件、电子邮件、视频、音频、图像、用户行为画像和小分子三维结构等。非结构化数据通常不符合固定的格式,其内容的组织方式和表达形式可以极其多样。因为缺乏明确的结构,处理和分析非结构化数据需要更复杂的方法和技术。通过大模型神经网络,我们可以把非结构化数据转换成计算机能够处理和理解的数据类型,这个数据类型叫做向量。变成向量以后,就可以让计算机对非结构化数据做分析、检索和管理,这样就可以赋能各种AI的算法和AI的应用场景。
而随着 AI 逐渐得到广泛的应用,需要存储和处理的非结构化数据和向量数据变得越来越多,就需要有一个专门的数据管理系统来存储管理、分析和检索,向量数据库就应运而生。
单纯的数据世界,是枯燥乏味的,但在数字经济时代,数据已经成为一种新型生产要素,是数字化、网络化、智能化的基础,国家在2023年底也在重点推行数据要素相关政策,并在各地开始建立数据交易所,这无疑让企业对数据的重视程度变得越来越高,也在重新思考数据到底可以在哪些业务应用场景发挥价值。
在与数据打交道多年、曾为美国Oracle公司云数据库创始工程师的星爵眼里,数据,却如繁花一般,绽放于大千世界,让业务变得鲜活而多彩。
经过7年的深耕,Zilliz向量数据库已经被广泛应用于RAG、大模型训练、数据去重、图文及视频搜索、推荐系统、问答系统、版权保护、反欺诈、自动驾驶、新药发现等场景。
1、大模型知识库(RAG):企业将私域数据经过文本分割和向量化后存储在向量数据库中,构建起专属的外部知识库,在后续的检索任务中为大模型提供提示信息,辅助生成更加准确的答案。
03
Zilliz Cloud为中小企业
降低AI应用的数据处理门槛
04
Zilliz未来要打造
一个非结构化数据的一个平台
05
Zilliz推出“Zilliz AI初创计划”
助力AI初创企业成长
相信更多如星爵般的创业者,凭借与生俱来的聪明勤奋和坚韧不拔,一定能趁此AI的东风,飞得更高更远。
微信扫码关注该文公众号作者
来源:i黑马
相关新闻
智库访谈丨张永炜:智能物联2.0时代,如何用数字化手段助力“双碳”目标的实现?智库访谈丨谢良兵:新型园区“新”在哪里?AIoT如何助力产业园区的智慧化与绿色化?智库访谈丨葛涵涛:AIoT助力下,智能家居能从“骨感的现实”走向“丰满的理想”吗?智库访谈 | 王建峰:掘金”数据资源,开启数据资产化时代马斯克最新访谈:AI不应被教导说谎,SpaceX和星链基本不用 AI奥特曼最新万字访谈:GPT-5能力提升超乎想象,算力将成为未来最重要的货币余华对谈库斯图里卡:了解一个人的人性要看他最脆弱的部分马斯克最新6万字访谈!8.5小时详解脑机接口、机器人、外星人,以及AI与人类的未来(一)历史首个!联合国大会通过有关AI的全球决议草案;库克在中国首谈生成式AI;周鸿祎:手机厂商不做AI会成为下个诺基亚丨AI周报励志!考研三次,读博七年的他成为最年轻的国家最高科学技术奖得主!AI教父Hinton最新万字精彩访谈:直觉,AI创新的洞见和思考,未来直播回顾|如何赚到100万访谈系列:红利下的跨境电商与短视频营销Sam Altman达沃斯访谈全文:未来最重要的资源是算力和能源谈一谈 分库分表 vs NewSQL数据库爱安特戴远敏:放弃铁饭碗,我用10年做了一个工厂自动化版的“宜家” | OMEGA访谈录与AI谈一场既反叛又安全的恋爱 | 编辑部聊天室克服磨难,跑赢时间,细说埃默里大学背后的教育故事|成长教育之道系列访谈<六>只关注“顶层架构”和“底线思维”的非典型家长,如何培养出被藤校青睐的孩子?|成长教育之道系列访谈<五>万字对谈 Perplexity AI CEO:广告是最伟大的商业模式,月付 20 美元的订阅制不是 |Z Talk扎克伯格最新2万字访谈:价值百亿美金的“最强开源大模型”Llama3及背后的一切奥特曼最新访谈:AGI即将出现,未来最重要的资源是能源和算力酷渲科技孙小雨:谁说中小企业不能拥有500强的培训资源 | OMEGA访谈录两次考研两个39分,七年才拿下博士文凭!如今成为最年轻的国家最高科学技术奖得主!苹果CEO库克最新访谈:并不能100%避免AI幻觉!