AI日报

blog-thum
大型开源数据集曝惊天丑闻,当红AI公司牵涉其中

LAION-5B 数据集于 2022 年 3 月发布,包含来自互联网的超过 50 亿张图像和相关说明文字,还可能包括数千条疑似儿童性虐待材料(CSAM)。该报告警告说,数据集中的 CSAM 材料可以使基于这些数据构建的人工智能产品输出新的且可能真实的虐待儿童内容。

read more
blog-thum
Apple不装了:AI iPhone将至!

Robin那句“卷大模型没意义”非常nice。有足够应用市场的技术产品才能推动整个社会的进步。与其说大模型需要变小,不如说大模型需要一种与之相匹配的硬核载体。

read more
blog-thum
聚焦数据,探索分布式数据库与湖仓一体的前沿应用

近期,51CTO举办了两场技术直播活动,围绕数据库前沿趋势和实践应用,分别以“分布式数据库应用与挑战”和“湖仓一体的技术实践”为主题,邀请了51CTO学堂金牌讲师以及数据库方向的企业技术专家进行分享,帮助用户更好地了解并掌握数据库领域的前沿技术趋势以及落地应用方法。

read more
blog-thum
从RAG到多模态搜索看OpenAI的技术演进

本文探讨了信息检索与文本生成领域的最新进展,特别关注了OpenAI的RAG模型及其在文本内容搜索上的应用。文章详细介绍了gpt-4-vision-preview模型,这一模型标志着从结构化搜索向非结构化搜索的重大转变,能够有效处理和解释多模态信息,如图片、表格和文本。

read more