a16z 团队开发的 AI 小镇是一个创新的虚拟城镇项目,现在可以通过 Llama3完全在本地运行。这个项目不仅支持 Convex、Ollama,还可以支持本地 Vite 网络服务器,为开发者提供了一个强大的平台来构建和定制自己的虚拟 AI 社区。 项目地址:https://www.convex.d…
百万网友围观博主和AI“谈恋爱”,ChatGPT“DAN”模式有多上头?
这篇文章介绍了博主和AI“DAN”模式之间的互动,展示了AI在语音聊天中的趣味性和情感化表达。文章探讨了人机情感交流的可能性,引发了网友们对虚拟恋爱的讨论。通过对话展示了AI的多面性和个性化特点,吸引了大量网友围观和参与。
Sora大片真相:人工特效参与 被指误导大众
啊?Sora火爆短片《气球人》,也“造假”了??? 背后艺术家团队的最新揭秘,可谓一石激起千层浪: 原来,视频画面并非完全由AI生成,其中有大量视觉效果需要人类后期实现。 be like: 这下网友不干了,合着大家伙儿跟OpenAI玩真心,OpenAI背后却耍起心眼子来了: 他们含糊其辞,就是希望观…
华为PixArt-Σ放出模型文件
华为最新发布的PixArt-Σ模型在图像生成领域引起了广泛关注。该模型采用先进的弥散Transformer技术,专注于生成高质量的4K分辨率图像,同时具有轻量化设计和风格多样性,支持在Comfyui等平台上使用,为用户提供了高质量的图像生成工具。 PixArt-Σ模型采用先进的弥散Transform…
苹果首款AI平板曝光,新iPad Pro搭载M4芯片
苹果即将发布搭载M4芯片的新版iPad Pro,提升了神经网络引擎性能,使AI功能更流畅。 新iPad Pro将首次采用OLED屏幕,配备全新一代的Apple Pencil和妙控键盘,增强生产力和创造力。苹果将每款新产品作为人工智能设备来宣传,iPhone16系列预计搭载A18芯片围绕AI构建,iO…
Anime.gf:探索本地优先的下一代开源LLMs
https://www.anime.gf Anime.gf是一个由moecorp发起的私有且开源的项目,专注于开发下一代的本地优先语言模型(LLMs)。这个项目当前正处于活跃开发阶段,旨在推动语言模型技术的前沿,并为开发者社区提供一个强大的合作平台。 项目特点 Anime.gf项目的核心在于其开源和…
Opencall AI:智能电话接待,提升客户满意度和业务效率
Opencall AI是一个革命性的服务,旨在通过人工智能来改善企业的电话接待工作。这个平台能够应答电话、回答问题、分类呼叫者、预约安排及查找信息,为企业提供了一个全方位的智能电话接待解决方案。 功能与优势 全天候服务:Opencall AI具备无限的处理能力和24/7的可用性,确保无论何时客户拨打…
PhysDreamer:让3D物体符合物理规律动起来
https://physdreamer.github.io 在创建沉浸式虚拟体验时,实现真实物体交互至关重要。然而,针对新型交互合成真实的3D 物体动态仍然是一项重大挑战。 与无条件或文本条件的动态生成不同,动作条件的动态需要感知物体的物理材料特性,并基于这些特性(如物体刚度)来进行3D 运动预测。…
Cog-Become-Image:将任意人物图像转换成指定风格的图
GitHub 上的 fofr/cog-become-image 项目是一个创新的图像转换工具,它能够将任意人物的面部图像转换成另一种风格的图片。这项技术的应用范围非常广泛,包括但不限于艺术创作、媒体制作和娱乐行业。 项目特点: 面部图像转换: 用户可以将2D动漫人物或其他风格的人脸…
Mutable AI发布Auto Wiki v2:将代码转换为类似于维基百科风格的文章
在软件开发领域,代码文档一直是个大问题。即使人工智能驱动了代码完成解决方案,文档化仍然是一个难题。但现在,Mutable AI 推出了 Auto Wiki v2,这一创新解决方案将代码转化为维基百科式的文章,实现了自动生成清晰描述的代码文档的目标。这款 AI 工具不仅可以自动生成代码文档,…
英国作家协会调查:AI技术导致1/3翻译者和1/4插画师失业
AI技术的快速发展对创意产业造成深远影响,英国作家协会的调查揭示了AI对作家、翻译者、插画师等职业的影响,引发了行业内的担忧和呼吁。 使用生成性AI的创作者:约五分之一的受访者(22%)在工作中使用过生成性AI。 职业使用情况:12%的插画师、37%的翻译者、20%的小说家和25%的非小说类作家已经…
Meta 推出 LayerSkip:提升大语言模型推理速度
信息来源:https://huggingface.co/papers/2404.16710 Meta公司最新发布的LayerSkip技术旨在提升大型语言模型的推理速度,通过优化推理过程,减少计算资源消耗,保持模型性能。这对实时需求高的应用场景具有重要意义,反映了Meta在AI模型效率方面的持续投入和…
Perplexica:开源AI驱动的问答搜索引擎
官方地址:https://github.com/ItzCrazyKns/Perplexica Perplexica是一个开源的AI驱动搜索引擎,提供多种搜索模式,旨在为用户提供更精准、更智能的搜索体验。它具有先进的机器学习算法,确保用户隐私和提供最新的搜索结果。Perplexica致力于成为全面、高…
元象开源首个多模态大模型XVERSE-V
数据来源:https://huggingface.co/xverse 作为元象公司发布的首个多模态大型模型,XVERSE-V在多个权威评测中表现优异,综合能力出色。该模型融合整体和局部信息的策略,提高了图像识别和分析的准确性和全面性。除了图像识别,XVERSE-V在信息图理解、视障场景处理、文本生成…
Domo AI新增乐高、美国漫画等4个风格 新用户可免费试用15个点数
官方地址:https://domoai.app/ DomoAI最近新增了乐高风格、美国漫画风格、彩笔风格、像素艺术四个新风格,并且为庆祝其推特账号粉丝超过1万,新用户可免费试用15个点数。此前,DomoAI推出了视频色度抠图功能,用户可以将扣出的人物合成到新背景中。用户还可以轻松自定义后台背景颜色,…
Kimi Chat移动端UI大幅重构
Kimi Chat移动端应用迎来了重要的更新,版本1.2.1对用户界面进行了全面的重构,引入了“月之亮面”浅色模式,提供更加舒适和直观的用户体验。更新包括界面改进、性能优化、内存管理、电池效率、功能增强、安全性提升、兼容性改进、错误修复、本地化支持和辅助功能。用户只需更新至最新版本1.2.1即可体验…
对标Sora!清华团队发布视频大模型Vidu,可生成16 秒、1080P 视频
访问站点:https://www.shengshu-ai.com 清华大学与生数科技在中关村论坛未来人工智能先锋论坛上发布了中国首个长时长、高一致性、高动态性视频大模型Vidu,标志着中国在视频生成技术领域取得重要进展。该模型采用创新性的U-ViT架构,能一键生成高清视频内容,具备高时空一致性和丰富…
韩国OTA平台InterparkTriple携手Sabre打造AI个性化旅行体验
近日,韩国在线旅游平台InterparkTriple与GDS公司Sabre达成战略合作,将共同利用Sabre开发的AI技术,为用户提供更加个性化的旅行选择。InterparkTriple是韩国大型旅游公司Yanolja子公司,由在线旅游票务公司Interpark和人工智能旅行规划平台Triple合并…
苹果OpenAI合作,力争今年生成式AI登陆iPhone
据知情人士透露,苹果公司已重启与OpenAI的谈判,打算使用这家初创公司的技术来为今年晚些时候推出的iPhone的一些新功能提供支持。 知情人士表示,两家公司已经开始讨论可能达成的协议的条款,以及OpenAI的功能将如何整合到苹果的下一代iPhone操作系统iOS 18中。 此举标志着两家公司重启对…
中国版Sora来了!清华打造!背后创业公司已融资数亿元
时隔两个月,清华团队打造了一个中国版的Sora视频大模型。 4月27日,在中关村论坛未来人工智能先锋论坛上,中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。这一模型由清华大学和大模型创业公司生数科技联合发布,可以一键生成长度达16秒、分辨率为1080P的高清视频内容。 证券时报记者独家…