「反 ChatGPT 神器」来了!背后还有一个被忽略的互联网难题

日期:2023-02-27 19:18:00 / 人气:131

在「立功」的路途上,人类能够是无师自通的。ChatGPT 火了,下一秒就有先生拿它来做作业、写论文,你很难说这究竟是作弊还是抄袭。教师很难确定先生的作业都出自本人之手,而人类也无法确定工具的最终形状究竟是什麼。面对本钱低、效率高的 AI 文字生成工具,仅靠人类的智慧曾经很难停止分辨。最顶尖的人工智能企业从「师夷长技以制夷」中学到的经历也用在了这里——它们要用 AI 辨认 AI。以 AI 治 AI,它们出手了OpenAI 是近年风头最劲的人工智能研讨室。过来一年你看到的文字生成视频、文字生成图像都有它的身影,ChatGPT 也是它的自得之作。根本每个月都会发布震惊业界效果的 OpenAI,刚发布的新商品却是一个 AI 内容检测器。这个检测器目前只能使用于文字内容,争议和批判更多的图像则不在此列。检测器独一的功用就是从人工智能的角度替你停止判别,看看这段文字是不是人工智能生成的。目前,只要美国地域的用户可以体验这个检测器的功用,检测器自身也对检测文本停止了一定的限制:英文文本,检测器和 ChatGPT 在英文外其他言语表现不佳。需求 1000 个字符,大约 150-250 个左右的单词才干生成更可信的后果。检测器在儿童撰写的文本内容上异样表现不佳,检测器次要针对成人英文文本停止训练。最终检测器会在完成判别后给出「很能够、能够、不清楚、不能够、十分不能够」5 种答案。这个检测器从目前来看也不太聪明。在测试中,有文章末尾显示「本文全文由 ChatGPT 撰写」的内容,检测器仍表示「不清楚」这篇文章能否由人工智能撰写。这也是检测器目前尚无法从了解文本上停止判别的「证据」之一。检测器的呈现意味意义比实践意义更大,这阐明知名的人工智能实验室们照旧在乎内容的真实。毕竟从 ChatGPT 降生开端,学校的教师就开端担忧先生的作业不再被仔细看待,世界上最大的学术出版商声明 ChatGPT 不能被记爲作者,还有人担忧新技术变爲欺诈的工具。而如今,人工智能实验室想努力区分内容的创作来源,这自身就是坏事。即使你是发明者,安能辨我是 AI坏事之外,多的是坏音讯。由于这个检测器的成功率有点惨不忍睹——26% 的精确率放在医学范畴属于谋财害命普通的存在,就算放在运动范畴预估运发动下一个举措能否得分的成功率都没这麼低。OpenAI 在发布这个工具时也供认了这一点。它有时会「错误但自信地」将人类书写的文本标志爲人工智能发明的文本,尤其是当文本与训练数据中的内容有较大差异时。目前这个检测器还很初级,甚至可以说这是一个「半成品」。除了 OpenAI 本人提到的儿童内容和非英文内容,有点年头的英文内容也很容易被误判。曾经去世的知名作家们的作品简直无一幸免,带有时代特征的表达方式很容易被断定爲 AI 作品。莎士比亚就惨遭毒手,他最短的喜剧《麦克白》就被断定爲「该文本很能够是人工智能生成的。」▲ 莎士比亚的作品很能够是 AI 生成的连发明者 OpenAI 都有点一筹莫展,区分 AI 生成内容的路途照旧任重道远。当然这也很棒了解,画作绝对文字还要更高门槛一些,经过笔触、作风、水印,大家还能看出 AI 模拟学习的痕迹。但文字没有「水印」,大家用创作出的文字也十分多样,由于创作者受教育的上下水平和表达作风,在最终文本上有较大差异也是可以了解的。▲ AI 发明的内容越来越接近人 图片来源:Midjourney甚至可以这麼说,等 ChatGPT 再进一步,能够人类都无法断定这能否是人工智能生成的文本了。由于它就像身边你我会写出来的内容——没有生疏的自创词汇,不会前言不搭后语,内容言之有物。假如人曾经分辨不出内容的源头了,那 AI 就成了将来的希望了。不论是用 AI 生成的内容自动加「水印」,还是检测器经过屡次迭代后正确率有限进步,AI 都是更好完成区分的特殊角色。除了发明者 OpenAI 外行动,还有不少学者、实验室、大企业都在努力区分 AI 内容。一个叫做 Edward Tian 的先生创立了一个网站,想要「检测 AI 抄袭」;Google 爲了不在人工智能开展中落伍,据称将上架 6 个 AI 相关使用,其中就有检测使用;剽窃检测器 Turnitin 正在开发本人的 AI 生成文本检测器。当然,这都属于将来,我们面临的现状是 AI 可以轻松制造少量内容,最终模糊信息源,而身爲普通消费者的我们将很难区分它的消费源头。AI 文本生成,随便净化信息的模糊将来还记得我们曾在《她在中文维基百科上胡编了上百万字的古罗斯历史,把俄罗斯人都骗了》写的故事吗?一个高中毕业生靠着「一腔热情」在维基百科上写了几百万字的历史内容,这些内容甚至传播到了外网,被很多外网内容援用爲来源。假如将这个高中毕业生看作 AI,你就能懂 ChatGPT 的存在对信息能够形成怎样的净化了。这位高中生 3 年编了百万字历史,AI 的效率只会比他更高。他用三年生成的内容,随着 AI 的提高能够三天甚至三小时不到即可生成。更低的内容制造本钱,AI 只会做得更好,毕竟它自身就是在模拟学习,持续模拟真实的历史生成一段「历史」并不难。当然,AI 还没有退化到《漂泊地球 2》Moss 那样的境地。它还没无意识要去做这件事,无意识也不一定有志愿去做这件事。但 AI 自身就是一种工具,就像用人用刀切菜做佳肴一样,也能够有人持刀伤人。千万别说没人这麼无聊,既然有人一字字都能编出百万历史,那门槛更低的 AI 内容会生成什麼故事、用于哪里都是正常的。人类的多样性总是超乎想象,当这种多样碰上了 AI 的高效,信息被净化的状况只会越来越多。

作者:168幸运飞艇官网




现在致电 5243865 OR 查看更多联系方式 →

COPYRIGHT 168幸运飞艇官网 版权所有