-
OpenAI官宣开放多模态ChatGPT 能看、能听、还会说
【OpenAI官宣开放多模态ChatGPT 能看、能听、还会说】未来两周内,ChatGPT付费用户将能用上“拍照片问问题”的功能;另外,移动端的ChatGPT也将支持AI语音聊天功能;根据官方的提醒,对于非英语用户来说,语音转录的 ... -
夸克发布自研千亿参数多模态大模型
11月14日消息,阿里巴巴智能信息事业群宣布推出全栈自研、千亿级参数的夸克大模型,它是基于Transformer架构、自主研发的多模态大模型。夸克方面表示,其自研大模型的整体能力超过GPT-3.5,部分场景优于GPT-4。 ... -
中信证券:谷歌Gemini模型发布 AI进入多模态时代
【中信证券:谷歌Gemini模型发布 AI进入多模态时代】中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在 ... -
谷歌Gemini、Pika的交集!多模态晋升AI热词 算力板块再次“躺赢”?
【谷歌Gemini、Pika的交集!多模态晋升AI热词 算力板块再次“躺赢”?】Gemini强大的多模态能力背后,是庞大的算力需求;Pika不是特例,最近已有多个多模态AI应用惊艳亮相;人工智能巨头在大模型领域的竞争依然白热 ... -
多模态AI下一步是3D内容生成? 新工具已火爆GitHub
多模态内容生成展示了AIGC广阔的应用空间, 3D有望成为下一个实现突破的模态。 近期,一款名为DUSt3R的AI新工具火爆微软旗下GitHub平台,只需2张图片2秒钟就能完成3D重建,无需测量任何额外数据。这款AI工 ... -
全面转向生成式AI!苹果推出300亿参数多模态大模型
【全面转向生成式AI!苹果推出300亿参数多模态大模型】相较于英伟达、微软等大型科技股,苹果今年的表现令人失望不已,股价年内跌逾10%,且失去了“全球市值最高公司”的宝座。背后原因很简单,苹果在这场人工智能(A ... -
卡位谷歌 OpenAI的神秘新品是什么?最新猜测:多模态AI助理
OpenAI决心抢在谷歌I/O大会前一天开直播、上新品,“演示像魔法一样的ChatGPT和GPT-4更新”。 这个神秘的新产品是什么?GPT-5和搜索引擎的推测已被OpenAI 首席执行官阿尔特曼亲自推翻。 从最新报道来 ... -
百度领投生数科技 加速布局多模态大模型
6月5日,生数科技完成数亿元Pre-A轮融资,本轮融资由百度、北京市人工智能产业投资基金领投,中关村科学城公司、启明创投等跟投。生数科技作为国内最早布局多模态通用大模型的团队之一,今年4月联合清华大学发布 ... -
支付宝发布多模态医疗大模型
7月5日,在2024世界人工智能大会“可信大模型论坛”上,支付宝发布多模态医疗大模型,同时推出包括医疗可信一体机、可信云等解决方案。据悉,支付宝医疗大模型经过半年多测试后推出,是国内首批多模态医疗大模型 ... -
Google深夜狙击OpenAI Gemini 2.0登场!全面转向Agent 多模态输入输出 免费随便玩
【Google深夜狙击OpenAI Gemini 2.0登场!全面转向Agent 多模态输入输出 免费随便玩】在OpenAI宣布连发12天更新后,Google选择12月11日深夜(在OpenAI发布更新之前),发布新模型Gemini 2.0。 ...