环球今亮点!生成式AI创企的大问题:不缺钱,缺训练数据
时间:2023-06-16 19:45:22来源:手机网易网

6月16日消息,多个生成式人工智能初创公司已获得数十亿美元融资,但如果无法获取适合的数据,那么就可能走向失败。这是一项艰巨的任务,因为大公司通常不愿与初创公司分享专有数据,尤其是在开发大语言模型时。


(资料图片仅供参考)

风险投资公司Primary Venture Partners的联合创始人和普通合伙人布拉德·斯沃卢加(Brad Svrluga)表示:“我们看到很多公司都在人工智能领域寻求卓越应用,但他们往往无法获得能开发强大应用的数据,更不用说能帮助他们在业务中拥有强大竞争力的专有数据了。”

现在,拥有合适数据比以往任何时候都更加重要。投资公司Bullpen Capital的驻场首席技术官保罗·泰马(Paul Tyma)表示,现在开发实际模型已经趋于商业化,真正的价值就在于数据。

根据PitchBook的统计,去年全年生成式人工智能初创公司获得的风险投资为48亿美元,但今年前五个月已经达到127亿美元。现在,其中许多公司都在金融或医疗保健等领域寻求构建更小众的人工智能模型,但要获得相关领域的训练数据集并不容易。

一些人工智能初创公司的目标是与拥有丰富数据的大型企业建立合作关系。例如,安永负责税务的全球副总裁玛娜·里克(Marna Ricker)表示,由于公司拥有海量的交易数据,每天都有开发生成式人工智能的初创公司前来接洽。但安永负责客户服务的全球管理合伙人安迪·鲍德温(Andy Baldwin)表示,他担心如果用安永的数据来训练外部模型会发生什么。

“到底谁拥有这些数据?当我们训练模型时,我们的访问权限是什么?其他人该如何使用这个模型呢?”鲍德温说。“数据也是我们知识产权的一部分。”

初创公司可以用每个客户的数据训练不同的模型,从而绕过知识产权问题。创业公司TermSheet正在利用这一策略打造生成式人工智能模型Ethan,这款产品可以为房地产开发商、经纪人和投资者解答行业问题。但TermSheet首席执行官兼联合创始人罗杰·史密斯(Roger Smith)表示,即便是让客户同意这样做,也需要费一番口舌。

法律科技公司Logikcull的联合创始人兼首席执行官安迪·威尔逊(Andy Wilson)则认为,如何让企业相信你拥有很好的网络安全状况,能够切实保护这些数据,这也是一个挑战。

风投机构Primary Venture Partners的斯沃卢加表示,大型科技公司在开发生成式人工智能应用方面可能比初创公司更有优势,部分原因是它们已经获得了大客户的信任,大客户对它们处理数据也很满意。

金融服务公司Truist的首席数据官特蕾西·丹尼尔斯(Tracy Daniels)表示,在探索人工智能用例方面,她目前只与大型技术供应商合作,而不是与初创公司合作。丹尼尔斯认为大型供应商更能保证数据安全。

这意味着,即使是那些抢先从公开数据中获得一定优势的初创公司,也要面对如何用企业数据集充实模型的挑战。人工智能初创公司Veesual可以生成用户试穿衣服的图像。公司最初利用互联网上的公共图像训练模型,但很难让大型零售商交出自家数据来增强效果。

Veesual首席执行官兼联合创始人马克西姆·帕特(Maxime Patte)表示,在某些情况下,大型零售商要求Veesual为使用相关数据支付巨额款项或拿出部分公司股份,但这些交易最终都没有谈拢。

PatentPal是一家帮助律师事务所起草专利申请文件的生成式人工智能初创公司。首席执行官兼创始人杰克·徐(Jack Xu)表示,公司用公开的专利申请文件训练模型。他说,继续用加密或匿名的实际客户反馈内容进行训练,可能会让工具更加准确。但这一过程很复杂,因为反馈必须与商业机密等高度敏感的数据分离开来。

“对处于早期发展阶段的创业公司来说,一个是品牌认知的问题,一个是社会认同的问题,”他说。

同时压力也在与日俱增。斯特拉克资本(Struck Capital)创始人兼管理合伙人亚当·斯特拉克(Adam Struck)表示,一些初创公司正在争相在某些细分市场获取更多数据,看谁的速度更快。

斯特拉克说:“如果你知道有一个专有数据集,你就会希望赶在别人之前得到它,然后就排他性进行谈判。”“从这个意义上说,这几乎成了一场军备竞赛。”(辰辰)

标签:

最新
  • 环球今亮点!生成式AI创企的大问题:不缺钱,缺训练数据

    6月16日消息,多个生成式人工智能初创公司已获得数十亿美元融资,但如

  • 【天天时快讯】京城股份(600860)6月16日主力资金净卖出164.40万元|观焦点

    截至2023年6月16日收盘,京城股份(600860)报收于10 59元,上涨1 53%,

  • 普通发票税率1%和3%有什么区别_普通发票税率3 怎么算 每日热闻

    你们好,最近小未来发现有诸多的小伙伴们对于普通发票税率1%和3%有什么

  • 环球报道:迈尼昂肌肉受伤,桑巴可能迎来法国国家队首秀

    北京时间6月16日消息,据《队报》报道,迈尼昂肌肉受伤,桑巴可能迎来

  • 打造工业行业标杆应用 苏州电信助力5G赋能从“制造”向“智造”升级

    打造工业行业标杆应用苏州电信助力5G赋能从“制造”向“智造”升级

  • 夏季达沃斯论坛将于6月27日至29日在天津举行 每日快讯

    记者今天(16日)从国家发改委了解到,世界经济论坛第十四届新领军者年

  • 第14次!东阿阿胶荣登《中国500最具价值品牌》榜单-环球实时

    6月15日,由世界品牌实验室主办的2023年“中国500最具价值品牌”发布会

  • 全球快讯:“盲盒经营”有规范指引才能行稳致远

    据报道,市场监管总局日前发布《盲盒经营行为规范指引(试行)》,明确

  • 防水板材有哪些

    防水板材是建筑中常用的一种材料,它具有防水、防潮、防火等功能,广泛

  • 【环球快播报】这届青年找工作,把小红书和抖音当作秘密武器

    这届青年找工作,把小红书和抖音当作秘密武器

  • 股市开盘后会有哪几种走势?股市开盘后多久可以买卖股票?

    股市开盘后会有哪几种走势?1、开盘,如果是先涨后跌再涨(1)开盘在前

  • 环球快播:601668股票怎么样 601668走势报告简述

    601668股票怎么样根据赢家江恩星级评定模型,给予中国建筑(601668)

  • 购房契税税率是多少?杭州房产税征收标准?

    购房契税税率是多少?购房契税是指以所有权发生转移变动的不动产为

  • 白敬亭有吻戏的剧很少咋回事 白敬亭为什么叫怀柔王子?-微资讯

    白敬亭有吻戏的剧很少咋回事1、白敬亭前期没有遇到合适的剧本,所以

  • 央视曝光大量人脸照片被售真的吗?收集人脸数据违法嘛?

    央视曝光大量人脸照片被售真的吗?一张静态的半身照,经过特殊的软件

  • 【播资讯】魔兽世界埃索达怎么去?去埃索达路线

    魔兽世界埃索达怎么去?1、联盟玩家们回到暴风城,走到暴风城港口在

  • 旅游
    • 扇贝黑黑的一坨是啥?扇贝上面的黑包是什么?

    • 公司对外担保有哪些法律风险?上市公司是股份有限公司中的一个特定组成部分吗?

    • 巨蟹座的女生虽然不是那种性格温柔的女生 爱情里面却愿意做听从者?

    • 病虫害对茭白的影响有哪些,包括什么内容在里面?