Bendi新闻
>
500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了

500行代码构建对话搜索引擎,贾扬清被内涵的Lepton Search真开源了

4月前
机器之心报道
编辑:杜伟
你可以说我「借鉴」,但我是真开源。
来了,贾扬清承诺的 Lepton Search 开源代码来了。


前天,贾扬清在 Twitter 上公布了 Lepton Search 的开源项目链接,并表示任何人、任何公司都可以自由使用开源代码。


项目链接:https://github.com/leptonai/search_with_lepton

也就是说,你也可以用不到 500 行 Python 代码构建自己的对话搜索引擎了。

今天,Lepton Search 又登上了 GitHub trending 榜单。


此外已经有人将这个开源项目用来构建自己的 Web 应用程序了,并表示质量非常高,与 AI 驱动的搜索引擎 Perplexity 不相上下。 


而就在几天前,关于 Lepton Search 项目,贾扬清还与 Perplexity 这家 AI 搜索引擎初创公司的印度裔创始人展开了一场「隔空对话」。

demo 被内涵,贾扬清选择开源

自贾扬清离开阿里创业之后,有关新公司 Lepton AI 的动态一直挺受社区的关注。

1 月 25 日,贾扬清在 Twitter 上宣传了一个 demo,用不到 500 行 Python 代码实现了 AI 对话搜索引擎,展现了构建 AI App 变得如此简单。


据了解,Lepton Search 具有以下特征:

  • 内置支持大语言模型(LLM)
  • 内置支持搜索引擎
  • 自定义 UI 界面
  • 搜索结果可共享、缓存

此外,Lepton Search 背后使用 MistralAI 开源的 Mixtral-8x7b 作为支撑模型,运行在 LeptonAI 的 playground 托管平台上,吞吐量高达 200 tokens / 秒。该搜索引擎目前使用的是必应搜索 API,Lepton KV 作为无服务器存储。

贾扬清表示,Lepton Search 的 idea 受到了 Perplexity AI、Phind 等由 LLM 驱动的搜索引擎的启发。


其中, Perplexity AI 成立于 2022 年 8 月,是世界上首个对话式搜索引擎,通过 GPT 这样的先进 AI 技术,它能够为问题直接生成答案,并对准确率与效率有很高的标准。该公司由前 OpenAI 研究科学家 Aravind Srinivas (Perplexity CEO)与前 Meta 研究科学家 Denis Yarats(Perplexity CTO)等合伙人共同创办。

该搜索引擎在发布后广受欢迎,被越来越多的人使用,并对谷歌等传统搜索引擎发起挑战。1 月初,该公司宣布完成了 7360 万美元 B 轮融资,最新估值 5 亿美元。

在看到贾扬清 Lepton Search 的 demo 后,Aravind Srinivas 发表了一段话,「非常高兴看到 Perplexity 成为未来融资活动的标杆,连前阿里巴巴技术副总裁都来借鉴。这说明了 Perplexity 的影响力不再停留在产品自身,还延伸到了整个生态圈层和行业发展。」


评论区的网友更是直白,认为 Lepton Search「复刻」了 Perplexity AI 的界面。


面对 Aravind Srinivas 的善意之言(kind words),贾扬清回应称,自己非常喜欢 Perplexity,它从根本上改变了人们对搜索的看法。Lepton AI 则专注于让创作者更轻松构建 AI 应用程序的现代云解决方案,Lepton Search 的 demo 展示了如何实现这一目标。当然该搜索项目的代码也会开源。


于是,我们看到了「search_with_lepton」项目。目前,该项目已经积累了 1.1k 的 Star 量。贾扬清也兑现了自己的开源承诺。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

来源:机器之心

相关新闻

500行代码构建AI搜索工具,贾扬清最新开源项目登顶GitHub热榜500行代码打造AI搜索引擎!贾扬清周末项目登顶GitHub热榜贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?贾扬清盯上了提示词和AI搜索替代MLP的KAN,被开源项目扩展到卷积了两分钟1200帧的长视频生成器StreamingT2V来了,代码将开源Rust 生态纯属炒作?3 年写了 10 万行代码的开发者吐槽:当初用 Rust 是被忽悠了对话林咏华:刚在“AI春晚”上开源了3.4T数据集的智源,是如何死磕大模型数据难题的击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了npm又被滥用,灰产用《庆余年2》盗版资源——把开源公共基础设施的羊毛薅秃了30 多年前被 Linux、Windows “ 灭掉 ” 的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源开源日报 | AI PC价值在哪?Windows格式化对话框的UI用了30年;丑头像生成器;独立Redis Copyleft分支大模型推理速度飙升3.6倍,「美杜莎」论文来了,贾扬清:最优雅加速推理方案之一又火一个惊艳的开源项目,诞生了!OpenAI的搜索引擎真要来了:开启灰度测试,微软Bing加持OpenAI的搜索引擎要来了!4个令人惊艳的开源项目,诞生了!比 Python 快 9 万倍的 Mojo 终于开源了!刚上线 star 已超过 1.7 万微信聊天记录导出的开源项目,火了!从 0 到 1 构建了一个属于自己的大模型,跑通了 | 极客时间前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库比Llama 3 推理更强的开源大模型出现了! Leetcode击败80%人类比VS Code快得多!用Rust重写,支持OpenAI、Copilot 的Zed编辑器开源了
logo
联系我们隐私协议©2024 bendi.news
Bendi新闻
Bendi.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Bendi.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。