返回首页
登录

CCF上海成功举办“ChatGPT探索AI语言的未来”线上活动

阅读量:90 2023-03-03 收藏本文

ChatGPT可能是近几年里最为被广泛认可的一个科技爆点,从帮学生写作业到帮州长写讲稿,从写小说到写代码改bug,ChatGPT时而惊艳绝伦时而被发现一本正经地胡说八道。202322013:00-14:30围绕ChatGPT的语料和算力、应用场景、潜在的监管和伦理风险等等方面迫切需要技术、投资、产业等各领域专家参与新话题的思考和讨论。本次活动执行委员:卫冕、王昊奋。


圆桌主持人

潘海量 启迪产业赋能中心北美首席合伙人、毕业于清华大学计算机系

圆桌嘉宾

王昊奋 同济大学百人计划特聘研究员,中国计算机学会CCF上海秘书长

Wisemont Capital管理合伙人,清华企业家协会TEEC总会理事

廖春元 亮风台董事长兼CEO、知名AR专家计算机博士

胡芳槐 PlantData CTO知识工程方向博士

圆桌主题

此次线上圆桌活动的主题是“ChatGPT探索AI语言的未来”。嘉宾们分别从自身专业角度出发,分享对人工智能和ChatGPT的看法和经验,并与大家展开了深入的交流和探讨,思想进行了碰撞和创新,为人工智能和ChatGPT的发展提供有益的启示和支持。

探讨实录

为什么ChatGPT这么火

王昊奋 长期研究知识图谱、NLP、对话式用户交互智能内容生成等领域

ChatGPT是一个生成式的预训练模型、大规模语言模型,可以给予不同的语言以及各种各样的任务很好的回应,同时确保流畅度、逻辑的自洽性,以及针对需要复杂计算和推理的一些任务也能够给出较好的回答。包括工作的小结、营销文案、代码等等。背后的原理说起来还算比较简单,自2017年谷歌提出了一个概念叫Transformer的模型,引入了自助意力机制,这个模型在做各种各样的理解和任务时可以进行深度的学习。基于此,OpenAI一直致力于做深层式自主学习探究开发研究。

预训练模型的研究,使得模型能够更好地理解和生成自然语言,而在训练这样的模型时需要大量的文本数据和计算资源,所以只有像OpenAI这样的大型机构才能够完成。通过训练大规模语言模型,可以将其用于各种任务,比如自然语言理解、自然语言生成、问答系统、机器翻译等等。而ChatGPT作为目前最大的一款语言模型,具有惊人的能力。它可以通过输入一些提示信息来生成高质量的文本、代码、甚至是音乐等等。同时,ChatGPT还可以实现一些简单的数学计算和推理,甚至可以通过和人类的对话来完成一些任务。这些功能让GPT-3成为了当前最具有代表性的一款大规模语言模型,也是AI技术进步的一个里程碑。

ChatGPT由两个单词组成,即“Chat”和“GPT”,GPT指的是Generative Pre-trained Transformer,是基于Transformer构建的预训练模型。这个模型通过自监督学习,即使用大量未标记的语料库,通过预测下一个单词或遮盖词语等方式,训练模型的语言理解和生成能力。OpenAI认为,一个很好的生成模型必定具有强大的理解能力。因此,不断发展ChatGPT模型,将其应用于各种多任务学习场景中,使得模型可以在各种文本任务上均有出色表现。同时,OpenAI也将GPT-1和GPT-2的源代码开放给大众使用。

ChatGPT是基于GPT3.5模型开发的对话聊天应用,能够以流畅的方式展现对话聊天。大模型的核心能力主要包括理解能力、生成能力和涌现能力。GPT具有三种能力:清晰的逻辑、因果思维以及零样本泛化能力。这使得它可以适应各种下游任务,并具有拒绝回答不合适问题的能力。此外,GPT的安全性方面也表现良好,这得益于Reinforce Learning From Human Feedback的应用。

人工智能具备适应和学习人类价值观、避免偏见和不适宜内容的能力,并能根据用户反馈和纠错不断进化。因此,人工智能是技术的集大成者,符合OpenAI的愿景,也是实现通用人工智能的一个长期目标。

胡芳槐  知识工程方向博士、PlantData CTO

ChatGPT带来了新的交互方式,比如能够快速生成大规模内容,并带来了非常大的想象空间,虽然它可能存在一些局限性。ChatGPT可能会改变知识工程和知识图谱等领域。虽然大规模预训练语言模型(如ChatGPT)可能会颠覆一些已有的知识图谱工作,但这种交互方式提供了更多、更好、更低门槛的内容,降低了AI应用的门槛,提高了用户的效率。这种能力能够带来巨大的想象空间,尤其在情报分析、影视营销等领域已经出现了非常大的改观。在教育、法律、金融和医疗等更深层次的领域,这种技术也在逐步深化和赋能。因此,这是一个非常重大的机遇。


过去十年在科技和投资圈出现了很多风口ChatGPT是一个风口?还是一个颠覆性的浪潮?

李峻 Wisemont Capital管理合伙人、投资硅谷早期高科技创业公司项目

Wisemont基金自2015年始,重点关注人工智能领域,投资早期项目,以长期影响力作为评判项目的关键因素。投资人工智能的原因是其作为一种基础性技术,具有长期影响力,且能够带来很多商业机会。此外,类比于之前的移动互联网、云和大数据等风口,人工智能在大数据时代的裹挟中爆发出现,人工智能在未来也将会对整个产业产生影响。

人工智能这个词并不是新发明,也不是第一次成为风口,但在2015年的左右,投资界普遍认为人工智能并没有到达真正的智能阶段,更多地是从商业分析或者“追风口”的角度去看待它。此时的模型还不够大,无法实现泛化智能。但今天,像ChatGPT或OpenAI这样的技术横空出世,是一个重要的里程碑,表明人工智能已经发展到了能够影响每一个行业的阶段。过去十年间,人工智能模型不断变大,现在已经到了一个爆发点,具备了足够大的模型和推理算法,对整个产业产生了重大影响,也带来了更多的商业机会。

但对于不同公司和行业,人工智能技术的影响程度是不同的。对于一些小公司来说,想要实现一定程度的智能化非常昂贵,因为它们缺乏足够的算力和数据以及对诸如OpenAI和ChatGPT等可以提供智能化服务的平台的支付能力有限。

人工智能技术的发展已经积累到了一个爆发点,越来越多的公司开始看到商业机会。OpenAI和其他大厂提供的大规模模型让很多公司可以节约成本,同时也让起点标准变低了。然而,应用人工智能技术还需要更专业的行业知识和数据。对于那些只做模型训练的公司,大厂的规模优势可能让他们失去机会。因此,人工智能技术的应用需要在技术的基础上结合行业特点进行深入研究。

在不同的领域中,机会的发现和时间点都不同。举个例子,像ChatGPT这样的技术改变了人机交互的语言,让商务人员能够更好地和程序员交流。因此,一些公司可能会裁掉一些商业分析师的工作岗位,因为他们发现他们不再需要这些分析师来帮助沟通。现在,有了类似ChatGPT这样的技术,商务人员可以使用这项技术来向程序员解释他们的问题。

另外,像ChatGPT这样的技术还可以通过Prompt Engineering来更好滴细化用户的问题,而不需要像谷歌一样进行多个测试来获得准确的答案。这种技术可以帮助商务人员更好地理解他们的问题,并提供更好的解决方案。同时,ChatGPT模型在应用中面对了许多安全性的挑战,特别是在中美两国不同的法律和价值观体系之间。对于这些问题,讨论包括伦理问题在内的解决方案是必要的。

廖春元 计算机博士、亮风台董事长兼CEO、知名AR专家

增强现实技术的本质是通过前端硬件和后端算法对人的工作和用户体验进行增强。将其与数字、人、技术相结合,可以实现更多的功能。然而这个问题仍然需要认真考虑。谨慎乐观地跟随这个技术的发展并指出应用场景可能是影响其发展的关键因素之一。

虚拟助手和数字人在垂直行业和企业中会有更多的应用场景,但它们的数据仍然有限。在处理专业问题时,这些工具可能会误导人,因为有些虚拟助手可能会胡说八道。对于个人消费级的产品,这个问题可能不是很严重,但是对于工业等严肃场合,可能会有严重后果,因为虚拟助手可能会发出错误的信息,而人们可能会过分相信这些信息。虽然数据有限但前景看好,同时也要谨慎对待,因为AI系统也可能出现不可控的情况。AI语言模型的能力在一般问题上高于普通人但低于专家。在垂直行业的应用中,AI语言模型能够提供有趣的回答,但其数据有限,有些问题可能无法回答或者回答不准确。因此,在实际应用中仍需谨慎对待。

虽然AI语言模型在未来有很大的想象空间和机会,但在目前的应用场景中,特别是在To B和To G领域中,仍存在着不可控的风险。需密切关注AI方向的发展,并尝试从中学习和吸取一些方法,以便将来能够更好地应用到自己的训练模型中。对待ChatGPT态度应是谨慎乐观,尝试从应用的角度探索这个方向的潜力。

利用ChatCPT这种工具时如何规避掉它的弊端?

王昊奋 长期研究知识图谱、NLP、对话式用户交互智能内容生成等领域

ChatGPT的应用场景可分为To B和To C两种类型,其中To C应用更注重对话界面的落地,具备强大的理解和生成能力,但在某些内容上还存在局限性。虽然ChatGPT在语言的组织和表达问题上取得了很大进展,但在逻辑上还存在一些不足。ChatGPT的出现使得许多之前想做的事情变成了可能,但在使用ChatGPT时需要谨慎乐观,可以吸取其方法,但要根据具体情况进行调整。人工智能模型在高层次的内容表达上具有相当大的优势,但信息量有限且常见的方法论居多。在实际应用中,人工智能模型需要面临时效性和真实性的问题,因为模型是基于语料库训练的,而语料库的知识和信息是有时效性的。

此外,在将人工智能模型与AR眼镜等设备结合时,真实性尤为重要。因此,模型需要具体且真实的知识来解决实际问题。使用大型语言模型处理行业问题的挑战有很多。首先,为了将专家经验和业务系统相结合,需要将知识固化并协调相关系统。其次,即使大型语言模型具有推理能力,其效率也远不及现有的数据库和大数据系统。此外,大型语言模型只能提供自洽的逻辑,无法提供循证证据,因此在Mission Critical的场景下不够可靠。

此外,大型语言模型也面临着根因分析和调试的挑战。为了提高其可靠性和实用性,需要更高质量的数据和资源。语言模型的发展,从传统的特征工程到现在的神经网络和提示工程,大型语言模型在处理某些内容上仍然存在困难,并且人类参与在整个过程中仍然是必要的。虽然大型语言模型可以产生很好的东西,但实际应用时往往需要工作量的大量堆积,并没有真正解决问题。

目前在AI领域仍有大量的工作可以做,但需要考虑成本和计算资源等问题。ChatGPT只是开启了一个新的纪元,相比以前的AlphaGo,它的优势在于能够完成更多的任务。虽然某种技术看起来能够解决各种问题,但实际上在面对某些特定的任务时,还有很多问题需要解决。这种技术积累了十年的相关经验,使得能够在更高的基础上解决更具挑战性的问题,甚至是以前不可能完成的任务。然而,无论是时间、效率、验证性、循证性、能耗、整合,还是效率成本问题,都存在很多问题需要解决。虽然已经解决了一些问题,但也有更多的问题需要解决。

ChatGPT值得发展的空间?

李峻 Wisemont Capital管理合伙人、投资硅谷早期高科技创业公司项目

在企业级别中,ChatGPT可能会首先释放其用途,随后是促进个体创造力的进一步发展。在未来,AR、VR、Web 3.0和区块链等领域被认为是下一个风口和机会,但可能需要更长久的时间来实现。OpenAI和ChatGPT目前处于测试阶段,并不具备权威性。因此,需要更多的数据反馈来提高它的准确性,需要更多的方法来判断这些“专家”在什么情况下可信。

还有数据隐私问题,企业在应用这些技术时需要注意的保护用户隐私的问题。在使用OpenAI的ChatGPT模型时,企业需要向模型提供更多的信息,例如具体的挑战和信息等。然而,企业需要注意保护数据的私密性。因为在使用这些数据时,机器人可能会泄露这些信息给其他人,这是一个很大的问题。特别是当企业上传一些敏感的数据,例如财报、内部代码和产品截图等时,这些信息可能会被泄露给竞争对手。因此,企业需要注意哪些数据是私有的,哪些数据是可以共享的。企业可以迭代模型以获取更多的知识,但必须注意数据的保密性。

在数字隐私、人工智能和开源数据方面现存的问题可能会推动未来数据使用和IP问题的解决。然而,存在一些实际问题,例如艺术的知识产权问题和不同文化背景之间的数据难以互通的问题。此外,中美之间的数据和价值观的差异也是一个挑战,因为训练者的价值观反映在数据上,所以如果文化背景和规则不同,训练数据便会难以使用。

在中国,各大公司都在研发人工智能,但是和更大、更高级、更长时间研发的系统相比还是有一定的差距,因为先发优势还是很明显的。举例来说,微软在搜索引擎领域追赶谷歌多年,智能方面差距不是很大,但是谷歌的引擎带来了更多丰富的边缘数据,最终微软虽收购了雅虎等公司但也未能赶超谷歌。

今天在人工智能领域中,由于第一批进入者具有信息优势和经验优势,使得这个领域的竞争变得更加激烈。同时,因为后续进入者需要更多的数据来升级他们的引擎,因此那些拥有大量数据的公司和国家将会拥有竞争优势,例如OpenAI。此外,提到竞争中的机遇,如隐私安全和数据交互等方面,都是能为初创公司的提供一些思路和机会。

创业公司在ChatGPT技术爆发中会有哪些机遇及挑战?

大型语言模型(如ChatGPT)带来的机遇远比带来的挑战和问题更加重要。虽然只有少数人能够直接从事大型语言模型的开发和训练,但更多人是可以直接利用大型语言模型的能力,例如使用ChatGPT构建自然语言处理应用程序。同时,挖掘ChatGPT的内在价值是非常具有意义的,因为它的训练过程中使用了很多Prompt和Instruct,这些方法可以应用于其他领域的建模和训练中。尽管这个过程需要大量的计算资源,但有可能可以通过一些方法来降低对计算资源的依赖,例如分布式计算等。现在在业界、学术界和研究界中,有很多专家正在尝试将搜索引擎和不同的大型模型结合起来,以发挥它们更大、更多的能力。与其要求一个大型模型能够包含所有能力,更好的做法是使用多个大型模型来叠加及结合,以发挥它们各自的优势。

在中文领域,大型模型的发展还面临着许多挑战。从参数量和数据量的角度来看,中文的模型已经和国外的模型水平相当。但在测试和实际效果方面,基础模型的能力还有所限制。这可能是由于中国没有先发优势,并且中文数据的结构化程度可能不如英文,这会对模型的发展造成一定的限制。因此,即使没有一个完全能够适配的基础能力模型,也可以使用多个模型叠加和结合来不断强化训练,在不同的行业和领域场景中寻找机会。

对于细节领域,基础模型本身也不一定能够概括所有问题,因此叠加和结合多个模型可能是更好的选择、这需要不断地梳理和总结领域相关的知识,并在之前的经验基础上进行调整和优化,如调整模型参数或进行二次训练。创业公司在这方面可行的发展路径,可以借鉴在学术和工程领域已有的一些成果。

国内创业公司在面临的挑战和期许中如何将业务与人工智能更好的结合?

廖春元 计算机博士、亮风台董事长兼CEO、知名AR专家

使用ChatGPT会有很多的难点。虽然令人惊艳,但对于垂直行业,特别是数据较少的县城和制造业老工厂等,数字化仍然是一个问题。对于创业公司和应用者来说,未来十年的目标太遥远。因此,从客户的角度来看,是否能够支持垂直行业中数据较少的情况并逐步实现数字化,显得很重要。同时,需要解决一些简单的问题,例如在智能制造中的应用。尽管像ChatGPT这样的自然语言处理技术离行业应用还有差距,但是从实际的商业角度来看,ChatGPT其实已经能够开始提供解决方案并在逐步地适应行业。假设有AI领域的创业公司能够为用户提供简单易上手的解决方案,即使数据量比较小,也能够逐步地提高工作效率和降低成本。这种渐进式的进化路线是非常务实的,10%的工作由机器来做,再慢慢逐步提高比例,而不是一步到位地替代人工。

所以,ChatGPT目前在具体应用落地方面存在的差距,为创业公司和中小型公司提供了很多商业机会。

从投资创业的角度来看投资会更看重哪些方面?考虑的风险点包括哪些方面?

李峻 Wisemont Capital管理合伙人、投资硅谷早期高科技创业公司项目

现在是一个重要的时间节点,许多企业的需求可以被满足,例如聊天机器人等的应用,而这为创业公司和中小型公司提供了很多商业机会。有行业经验的公司可能会是投资的重点,因为企业需要拥有数据、客户信任和行业积累才能够成功落地。许多行业已经开始在人工智能领域积累人脉和客户,未来能够提供更多的机会、使用更智能的模型,提升客户体验和生产力,这为行业提供了商机。除了行业积累和客户理解,数据和人脉也是重要因素。

但是,目前仍存在一些关键技术问题需要解决,需要更多落地实践和细节工作。此外,OpenAI已经开放了很多API,可以整合和对接不同的智能模型和搜索引擎,从而提供更好的服务和解决方案。在未来,Prompt Engineering也可能成为一个重要的投资领域。

总的来说,如果有行业经验和关系,很多机会都值得进一步研究和探索。人工智能和自动化技术对科技公司具有长期的价值和进步的步伐。长期来看,需要不断学习新技术以跟上下一代迭代的步伐。在实际应用中,文本方式的人工智能需要与硬件和物理实验相结合,以促进材料学和制药学等领域的发展。虽然人工智能能够快速生成更多的解决方案,但在人体试验和物理实验中,仍需要大量时间和资源。因此,自动化技术在加强物理实验和生物学方面需要继续探索提高新药研发的速度和准确性。

在未来的技术发展中,短期内的机会可能在于数据分析、自动化和人工智能等领域。而长期来看,与硬件相关的领域如AR,可能会成为下一个风口。尽管目前AR硬件的用户体验还有待改善,但像Mid Journey和OpenAI这样的新技术能够提供更多的可能性,释放创造力。期待在硬件方面能够实现突破,以实现更多的内容创作机会。总之,需要不同的思考和眼光,以抓住即时的机会和长期的发展趋势。

中国在过去五年投资建设了大量的数据中心算力规模全球第二,增长速度全球第一能够带来新的红利吗?

胡芳槐 知识工程方向博士、PlantData CTO

毫无疑问,会带给我们一波新的人工智能红利,但这些红利可能更多的聚焦在于一些头部的厂商、互联网的大厂,当然也会出现一些与AI相互配套的基础模型及服务,对于广大的创业者、用户都能够带来发展的福利。另一方面,也会有些相对悲观的要素出现,高端的算力显卡由于一些不可控的因素已经对国内形成一定的制约,面对指数级的增长,可能遇到极大的压力,这种压力也会相对集中在做基础模型的头部企业。目前的算力已经基本足够,很多情况下可能也不需要大量的数据以及训练模型。所以,短期内对于国内企业还是处于一个红利时期。但是长期来看,可能还是需要突破及解决算力问题。

互动环节

ChatGPT在老年人关怀护理方面的应用?

李峻 Wisemont Capital管理合伙人、投资硅谷早期高科技创业公司项目

有一些公司通过数据分析的方式来帮助解决阿茨海默症,包括基因分析等。对于老年人的关怀问题,人工智能技术可以提供一些可能性,但是也存在一些难度,例如老年人语音识别的问题。现有的语音识别技术并不完善,样本也比较少,而且人工智能训练的成本较高。虽然这个领域的潜在收益很大,但目前并没有很多公司关注并投入实践。老年人市场在语音技术领域中的困境,主要原因是经济效益不好,缺少初创公司的投入和关注,也缺乏数据的收集和标注。虽然近年来语音技术受到越来越多的关注和应用,但对于老年人这个市场来说,因为缺乏数据和标注,难以有一个很好的发展。但对于大模型来讲,仍有降低创业公司成本的效用,从而能够带来更多的机会和可能性。此外,虽然语音生成等技术可以生成文字和语音,但老年人仍需要专业的护理人员的实际物理护理,因此技术并不能完全解决所有问题。迭代可以使助听器交互系统更加智能,更方便自理的老人使用。期待有专门致力于这方面的团队,因为老龄化人口市场的存在需要更加专业的团队去开发相关产品。

如果法律对ChatGPT输出的内容做进一步的确权确责,会影响这类产品的发展?

王昊奋 长期研究知识图谱、NLP、对话式用户交互智能内容生成等领域

在人工智能治理与道德伦理方面,需要像物理世界一样建立规范和准则,而不是限制其发展。这需要大厂和机构努力实现“负责任的AI”,并解决公平和偏见等问题。没有目标性和无序的发展可能导致有害的结果。随着智能程度越来越高,这个问题变得更加重要。最近有很多反对声音,但这是好事,因为它将各个赛道融合在一起,几个例子是生成的艺术品版权问题、数字资产的版权问题和如何通过Web技术来加强确权、溯源和激励机制。交叉整合不同技术可以创造更多的创新机会,尤其是破坏式创新。支持这种变革,打破传统观念和舒适区,便可开创更广阔的视野和格局。

主持人结语

潘海量:要相信人类自己的力量,要勇于和人工智能去竞争。让AI成为我们手中更好的实现创意的工具,而不是人类成为AI的工具。