找回密码
 立即注册
查看: 184|回复: 5

OpenAI 推出 AI 文本检测器,「AI枪手」引担忧,文本检测 ...

[复制链接]
发表于 2023-2-6 13:33 | 显示全部楼层 |阅读模式
ChatGPT带来的喧嚣还未归于平静,北京时间2月1日,其背后的公司OpenAI又趁热打铁推出了一款检测工具,试图区分人工编写的文本和AI生成的文本。
这款工具名为AI文本检测器(AI Text Classifier),《每日经济新闻》记者亲测了其检测效果,发现其能成功区别单独的人工或AI文本,但当人工和AI文本混淆时,检测效果并不乐观。不过,OpenAI认为,当这个检测工具与其他方法结合使用时,可能有助于防止 AI文本生成器被滥用。
“它仍然有一些局限性——因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,”OpenAI在一份官方文件中表示,“我们正在提供这个初始检测器,以获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。”
随着ChatGPT的大热,市场围绕生成式 AI的热情不断增长。但以北密歇根大学“论文作弊”为代表的事件也引发了对于学术、伦理等方面的诸多担忧。一些批评者认为,生成式AI工具的广泛使用可能会带来一些潜在的有害影响。
直接的后果是,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT。自然而然地,对类似AI文本检测器的工具的需求也开始涌现。
发表于 2023-2-6 13:39 | 显示全部楼层
我们看一下ChatGPT是怎么回答这个问题的:


AI 生成论文带来的问题,包括担心生成的论文质量不高或抄袭他人工作,破坏了学术诚信。因此,OpenAI 推出 AI 文本检测器以识别可疑文本,帮助确保学术诚信。
随着 AI 文本检测器的普及,可能会有人对 AI 生成论文进行更加高级的破解,以逃避检测。这可能是一场“猫鼠游戏”,即不断提高检测标准和破解技术的循环。
但是,这不是一个无解的问题。我们可以通过不断提高 AI 文本检测器的技术水平,以及强化学术诚信和监管措施,来确保 AI 生成论文的质量和诚信。
因此,OpenAI 推出 AI 文本检测器是一个积极的举措,有助于维护学术诚信,但我们仍需保持警惕,继续努力确保 AI 技术的合理和道德使用。
<hr/>下面说一下自己的看法
随着ChatGPT这样的应用开始普及,AI枪手确实可能泛滥成灾。下面是最近发生的例子:
北密歇根大学的哲学教授Antony Aumann在为自己任教的一门世界宗教课程评分时,惊喜地读到了一篇「全班最好的论文」。在这篇论文中,作者以简洁的段落、恰当的举例和严谨的论据,探讨了罩袍禁令的道德意义。是的,聪明如你肯定猜到了:这篇文章是用ChatGPT写的。
学生用ChatGPT拿下全班最高分,教授惊呆!全美高校打响AI反击战对于大多数人,只要稍稍提示一下,ChatGPT就能生成妙笔生花、文采斐然的文字。现在,它已经被用来写情书、诗歌、同人小说……以及学校的论文。因此非常有必要开发相应的文本检测器,防止AI枪手越来越严重。
但是除了开发相应的文本检测器之外,我们还应该规范ChatGPT的使用,目前已经有学校出台了相应的措施:在纽约和西雅图的公立学校系统,学校的Wi-Fi网络和设备上已经全面禁止了ChatGPT。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2023-2-6 13:41 | 显示全部楼层
话说,最近ChatGPT的热搜有点太频了吧,有古怪。。
几乎就是冲击一个行业安排一条热搜,公司有什么风吹草动也会立马安排几条热搜!
大胆预测:
后面有竞对跟进的话,相关热搜注定少不了;
有国内企业模仿创(抄)新(袭),铁定继续安排上热搜;
未来一段时间,接连霸榜是少不了的;
……
结果您猜怎么着?
嘿!
你不聊ChatGPT都不好意思在圈子里混嘞~~~
tips:咱就拿登梯子体验功能这事儿来说吧,账号需要购买,加速器也需要额外付费;
平均每个人不用太多,5块钱,10万个体验用户闻声而动,都够我奋斗好几年了!
真不是酸,只是单纯眼红..
( ╯□╰ )
<hr/>我是汇智妹,软件工程师一枚,公众号【汇智动力学院】
每天除分享技术干货外,也聊聊圈子里热议的那些事儿,有意转行IT的同学欢迎关注一波,查阅更多就业数据及成功转行案例~比心
发表于 2023-2-6 13:50 | 显示全部楼层
在OpenAI推出这种文本检测器之前,就有普林斯顿的学生自己写的GPTZero,算是第一个AI文章检查器。我在之前的回答中也有过提及:GPTZero:第一个AI文本检测器
现在这个OpenAI官方发布的AI文本检测器,听起来很强大,不过很快就被人玩坏了。
Sebastian Raschka 是一位人工智能 (AI) 和机器学习 (ML) 研究员,在Lightning AI担任首席 AI 教育家。[1]
他用他自己2015 年出版的一本书中的文本片段去测试OpenAI 文本分类器。
然后收到的三个不同段落,有各不相同结果——
该工具报告说:“不清楚”这本书的序言是否由 AI 撰写;但前言是“可能是人工智能(Possibly)”,第一章的一段是“可能是(Likely)”人工智能。
更有意思的是,有人把莎士比亚的短篇悲剧《麦克白》(Macbeth)的第一页扔上去测试了一下,结果这个检测器认为:这可能是AI写的。
“The classifier considers the text to be likely AI-generated.”


<hr/>AI文本检测器的检测能力,非常依赖于其训练时被投喂过的材料内容。
这类工具的训练数据不包括莎士比亚时代的古英语,那么自然无法确定这个麦克白究竟怎么来的。
事实上,OpenAI承认这种检测器也是种GPT模型,其训练数据集由人类编写和AI编写的文本段落组成,而目前其准确率仅为26%左右。
可见,这种AI文本检测技术,还有很长的路要走。
不过可以肯定的是,需求的存在,必然会助推这种猫捉耗子的游戏进行螺旋升级。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
发表于 2023-2-6 13:53 | 显示全部楼层
是不是在玩猫捉老鼠的游戏我们不知道。
不过,OpenAI 可以用这种方式来持续保持热度,推出 ChatGPT 让自己登上了风口浪尖,市值涨了一波,现在再推出一个 ChatGPT 的检测工具,可能又会让自己保持一段时间的热度,或许,市值又能大涨一波。
而且,用魔法来打败魔法的背后,OpenAI 的目的可能是想用人工智能来训练人工智能的方式,让 ChatGPT 的进化更上一层楼。
毕竟,当自己掌握了如何检测是否为 AI 所创作的内容之后,就相当于找到了 ChatGPT 的漏洞,然后再进一步针对性的弥补,让 ChatGPT 进化更像人,岂不是非常完美?
一句话:用人工智能去训练人工智能,然后抹去人工智能的痕迹,最终让人工智能更像人,这可能是一种效率更高的进化方式。
发表于 2023-2-6 13:59 | 显示全部楼层
OpenAI祭出AI文本检测利器,ChatGPT即将上演“猫鼠游戏”?

每经记者 文巧    每经编辑 高涵   
ChatGPT带来的喧嚣还未归于平静,北京时间2月1日,其背后的公司OpenAI又趁热打铁推出了一款检测工具,试图区分人工编写的文本和AI生成的文本。
这款工具名为AI文本检测器(AI Text Classifier),《每日经济新闻》记者亲测了其检测效果,发现其能成功区别单独的人工或AI文本,但当人工和AI文本混淆时,检测效果并不乐观。不过,OpenAI认为,当这个检测工具与其他方法结合使用时,可能有助于防止 AI文本生成器被滥用。
“它仍然有一些局限性——因此它应该被用作其他确定文本来源方法的补充,而不是作为主要的决策工具,”OpenAI在一份官方文件中表示,“我们正在提供这个初始检测器,以获取有关此类工具是否有用的反馈,并希望在未来分享改进的方法。”
随着ChatGPT的大热,市场围绕生成式 AI的热情不断增长。但以北密歇根大学“论文作弊”为代表的事件也引发了对于学术、伦理等方面的诸多担忧。一些批评者认为,生成式AI工具的广泛使用可能会带来一些潜在的有害影响。
直接的后果是,美国一些最大的学区已禁止在其网络和设备上使用 ChatGPT。自然而然地,对类似AI文本检测器的工具的需求也开始涌现。
亲测OpenAI的AI检测器效果:并不完美

《每日经济新闻》记者注意到,有趣的是,OpenAI新推出的这款检测器在架构上和ChatGPT一样,它也是一种AI语言模型,并且也是根据来自网络的许多公开文本示例进行训练的。
但与ChatGPT不同的是,它经过微调可以预测一段文本由AI生成的可能性——不仅来自ChatGPT,还来自任何文本生成AI模型。
具体来看,OpenAI在来自5个平台(包括OpenAI本身)的34个文本生成系统的文本上训练了这款AI文本检测器,例如维基百科等。不过,这款AI文本检测器至少需要1000个字符,即大约150 ~250 个单词,才能进行检测。
那么,这款检测器的效果到底如何?是否真的能完美区别AI和人工生成的文本?每经记者对此进行了一番测试。
我们先让ChatGPT写了一篇主题为AI未来的文章,并用检测器对其进行检测,结果显示,“检测器认为文本很可能是AI生成的”。



图片来源:AI Text Classifier

随后,我们用了一篇人工写作的文本再次进行检测,结果显示,“检测器认为文本非常不可能是AI生成的”。



图片来源:AI Text Classifier

从上述结果来看,OpenAI的这款AI文本检测器的确成功区分了人工和AI生成的文本。然而,我们将两个文本结合后(AI文本占比超90%)再进行检测,它并不能检测出AI生成的文本。



图片来源:AI Text Classifier

从每经记者亲身体验来看,目前,要靠这个AI文本检测器来抓作弊还有些困难。
据OpenAI的一份文件,该检测器将文本标记为“非常不可能”由AI生成的可能性小于10%;“不太可能”由AI生成的可能性为10%~45%;“不清楚它是否是”AI生成的可能性为45%~90%;“可能”是AI生成的几率为90%~98%。
在准确性上,OpenAI也承认,“鉴于AI生成的内容在互联网上的激增,它可能无意中将一些AI编写的文本错误分类为人类编写的文本。”
“AI枪手”引担忧,“猫鼠游戏”就此开始?

1月中旬,北密歇根大学的论文作弊事件让学术界着实震惊了一把。在这次事件之后,在美国,许多大学教授、系主任和管理人员都在对课堂进行大规模的调整,以应对ChatGPT对教学活动造成的巨大冲击。很多教授在重新设计课程,更多地采用口试、小组合作和手写文章作为评估方式。
纽约和西雅图等最大的学区最近已禁止在其设备和网络中使用 ChatGPT,许多大学也在考虑采取类似措施。
在更早之前,全球最大的编程技术问答网站Stack Overflow紧急宣布,ChatGPT在该站暂时封禁。Stack Overflow在官方通告中表示,做出这个规定的主要原因是,ChatGPT自动生成的答案质量太低,错误太多,而且看上去还挺像那么回事,即使是完全不懂的人也能随便生成答案。
在“AI枪手”带来的担忧之下,一些其他的AI文本检测器也如雨后春笋般涌现,以满足当前的需求。
在OpenAI推出自己的检测器之前,普林斯顿大学的一名学生Edward Tian开发了ChatZero,来检测文本是否可能是AI生成。据报道,1月3日,该网站一经上线,一周内就有超过3万人试用。



一名用户展示GPTZero的检测效果 图片来源:推特

不过,一些用户也报告了GPTZero检测的错误结果。Edward Tian也承认,检测并非百分之百准确,他仍在努力提高模型的准确性。
据此前报道,包括斯坦福大学在内的一些机构联合提出一种名为DetectGPT的新方法,来区分AI生成的文章。
开源AI社区Hugging Face也推出了一种工具来检测文本是否由 GPT-2 创建,GPT-2 是用于开发 ChatGPT 的 AI 模型的早期版本。据悉,南卡罗来纳州的一位哲学教授用这个工具抓获了一名提交了 AI 编写的作业的学生。
除此之外,谷歌搜索以及检测学术抄袭的Turnitin也正在开发自己的AI生成文本检测器,谷歌搜索据悉至少会推出6个应用程序来对AI和人工文本进行区分。
科技媒体Techcrunch对此评论称,这很可能会成为一场猫捉老鼠的游戏。随着文本生成AI的改进,检测器也会改进——这是一种永无止境的来回交流,类似于网络犯罪分子和安全研究人员之间的交流。
正如OpenAI 所写,虽然检测器在某些情况下可能有所帮助,但它们永远不会成为确定文本是否由AI生成的可靠唯一证据。“也就是说,目前还没有灵丹妙药可以解决AI生成的文本所带来的问题,”Techcrunch这样写道。
如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Unity开发者联盟 ( 粤ICP备20003399号 )

GMT+8, 2024-11-24 08:38 , Processed in 0.068008 second(s), 23 queries .

Powered by Discuz! X3.5 Licensed

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表