AI日报:Llama3.1重磅上线;可灵上线国际版1.0并开启付费计划;腾讯PhotoMaker V2升级
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、最强开源模型来了!Llama3.1以405B参数领先GPT-4o
在人工智能的世界里,开源与闭源的较量从未停歇。Meta AI的Llama3.1模型的发布标志着开源AI走向成熟,预示着一个全新的时代即将到来。Llama3.1表现超越闭源模型,在性能上与闭源模型并驾齐驱,开启了开源AI可能成为行业标准的新时代。
2、可灵AI视频开启付费计划 结束免费生成体验
可灵宣布结束免费生成体验,推出多层次付费会员计划,为用户提供更多样化的服务选择。新会员体系包括非会员、黄金会员、铂金会员和钻石会员,享受限时五折优惠。可灵定价亲民,性价比高,满足不同用户需求。转变商业模式展现成熟,将在AI视频生成领域发挥重要作用。
3、快手AI视频产品可灵国际版1.0上线
快手今日宣布,其AI视频产品可灵国际版1.0正式上线,用户无需中国手机号码,每日登录可获得66个免费积分,引发全球热烈反响。可灵迅速崛起,改变AI视频格局,被视为国产AI模型向国际市场进军的重要一步。付费用户体验提升,定价合理,保持竞争力。
4、AI视频编辑神器Vozo 可使用提示重写脚本并重新配音
Vozo是一款颠覆性的视频编辑工具,利用人工智能技术彻底改变了内容创作方式。它通过智能视频重写与重配音、文本驱动的语音编辑、多角色口型同步等功能,为用户提供了前所未有的视频编辑和改编能力。同时,Vozo支持专业视频翻译和自动视频优化,极大地简化了内容的国际化过程。
5、PixVerse V2视频模型发布 支持直接生成8秒视频
PixVerse发布了V2版本的视频模型,可以直接生成长达8秒的视频,提升了画质和细节。这款工具让用户的创意无限,细节控制精准,连贯性强,场景丰富。操作简单,满足各种风格需求,让用户在8秒内创造一个世界。
6、腾讯PhotoMaker V2升级 几秒钟完成个性人物图像定制 无需训练LoRA
腾讯近日发布了PhotoMaker V2版本,革命性提升AI个性化人物图像定制效率和质量。通过ID嵌入技术,实现快速高质量个性化图像生成,无需繁琐训练过程。提升图像ID真实度,增强用户生成控制能力,效率提升近4倍。开启个人用户和专业创作者新可能性,简化个性化图像内容创作过程。AI技术进步将改变创意产业,催生新艺术表现形式和商业模式。
7、北大出品新3D场景生成框架HoloDreamer
HoloDreamer是一款新型的3D场景生成框架,通过用户的文本描述生成身临其境、完整的3D场景。这一创新性进展将推动文本驱动的3D场景生成研究,为虚拟现实、游戏和影视行业提供新的解决方案。
8、Adobe为Illustrator和Photoshop引入更多生成式AI功能
Adobe最近推出了新一轮的生成式AI功能,旨在提升设计软件Illustrator和Photoshop的创作流程效率。这些更新包括Illustrator的生成式形状填充工具和Photoshop的图像生成功能,为设计师提供更多创作自由和便利。尽管引发了部分创意专业人士的担忧,Adobe强调生成式AI的目的是增强创意表达而非取代人类创意。这一系列更新是Adobe自去年推出Firefly模型以来的最新成果,希望为创意行业带来更多创新机会。
9、快手:添加AIGC内容“作者声明”不会影响作品流量
快手平台推出了新功能“作者声明”,鼓励创作者在发布AI生成内容时添加声明,以减少误解。创作者需遵循操作引导手册,可通过作者声明标注AI生成内容。添加声明不影响作品流量,除非违反法律或规则。更新快手app至最新版本可解决标识操作入口问题。快手希望与创作者合作,共同打造真实有趣社区环境。
10、快手可灵团队开源项目LivePortrait爆火 一张照片生成动态视频 大叔秒变少女!
快手可灵团队开源的人像视频生成框架LivePortrait在人工智能领域引起轰动,展现了AI技术在视频生成领域的巨大潜力。该项目在GitHub上已获得7.5K星标,成为当下最热门的AI项目之一。LivePortrait不仅能让静态图像动起来,还能精确复制表情到不同人身上,具有广泛的应用价值。
11、百川智能联合天津大学推出“Sibyl System”Agent框架 登顶大模型复杂任务榜单GAIA
百川智能与天津大学合作推出的Sibyl System智能体框架在GAIA Leader Board上取得第一名成绩,突显其在复杂任务执行方面的卓越能力。GAIA评测方案揭示了现有模型的能力缺陷,为模型研发提供改进方向,要求AI具备推理、多模态理解、网页浏览和使用工具等能力。Sibyl System框架设计特点包括类人的浏览器界面替代检索、问答替代对话、引入“陪审团”机制等,实现了模型从“快思考”到“慢思考”的转变。
12、微软VALLE-2模型实现零样本文本到语音技术
微软发布的VALLE-2模型实现了与人类同等水平的语音合成,被认为是TTS领域的里程碑式进展。该模型展现了惊人的即时模仿能力,提高了解码稳定性,加速了推理过程,简化了数据需求,超越了前代模型VALLE,引发了关于技术伦理和责任使用的深度思考。
13、LazyLLM: 提高LLM长文本推理效率
LazyLLM是一项由苹果公司和Meta AI联合推出的新技术,旨在提高大型语言模型在长文本推理中的效率。该技术通过动态选择重要token来加速LLM推理过程,在长文本场景中表现突出。LazyLLM不需要对现有模型进行改动,易于实施,同时能显著提高推理速度,保持较高的准确性。
14、谷歌二季度收入达850亿美元,AI与搜索业务助力增长
谷歌在第二季度取得了令人瞩目的成绩,收入达到850亿美元。其搜索业务和云计算部门表现突出,AI技术的应用也取得了显著进展。此外,谷歌放弃了逐步淘汰第三方Cookie的计划,转而推行用户知情选择政策。整体业务增长势头良好,展望未来发展潜力巨大。
版权声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。