用魔法打败魔法:抓住AI枪手,ChatGPT检测器千呼万唤始出来
OpenAI的聊天机器人ChatGPT自从发布以来,正变得越来越强大,从接受普通网友的“调戏”,到“低空飞过”明尼苏达大学法学院和沃顿商学院的课程考试,甚至通过了医学考试,以至于开始成为学校老师的“公敌”。如果不加以限制,ChatGPT将会变成史上最强大的作弊工具——帮助学生们写作业,甚至是完成考试论文。
(资料图片)
正如我们,越来越多的学校和老师已经表达了对ChatGPT作弊能力的担忧。纽约市和西雅图的公立学校已经禁止学生和教师在学区的网络和设备上使用ChatGPT。
但是,靠着老师和学校的盯梢,想要让学生们避开ChatGPT的诱惑,几乎是不可能的事。所以,打开了潘多拉盒子的OpenAI,只好自己出马,用魔法来打败魔法。
用魔法打败魔法
今天,OpenAI官宣推出一个新工具,立马又上了头条:一个名为AI Text Classifier 的文件检测器,来帮助人们检测一段文本是由人类自己创作,还是由AI编写的。
不过有点戏剧性的是,这个检测器也同样是基于GPT模型。根据OpenAI的介绍,这个AI文本分类器是一个经过微调的GPT模型,可以检测一段文本是否是来自于市面上的各种AI工具, 包括但不限于ChatGPT。
该工具包含一个文本框,用户可以在其中输入至少 1000 个字符长的文本,点击提交后,每个文档会被判断为“非常不可能”、“不太可能”、“不清楚是否是”、“可能是”AI生成的。
根据OpenAI的说明,这个检测器也有不少限制,包括:
•至少需要 1,000 个字符,即大约 150 - 250 个单词。
•结果也并不能保证完全准确;它可能会错误标记 AI 生成的文本和人工编写的文本。
•人类用户可以简单编辑 AI 生成的文本,以避开检测。
•检测器有可能会错判儿童写的文本和非英语文本上,因为它主要是针对成人书写的英语内容进行训练的。
那到底ChatGPT和ChatGPT检测器,谁厉害?硅星人进行了测试。
我们先要求 ChatGPT 写一篇超过1200字的关于无人驾驶汽车的文章,然后全文输入检测器,检测器很准确地识别出来,将其判断为“可能由 AI 生成”。
图片来源:ChatGPT
但是随后,我们又用ChatGPT 生成了一篇同样主题的972字的文章,自己在文章后加入了一两句无关紧要的话,以满足检测器1000字的要求,就这样小小的操作,检测器就受到了迷惑,返回的结果表示“无法判断是否由AI生成”。
在硅星人的小样本量测试上,这个检测器虽然有一定程度的准确性,但是要迷惑它,对于狡猾的人类来说,简直是轻而易举。
OpenAI 显然也意识到了这个工具的局限性,因为它在博客里强调,不要仅仅凭借这个检测器来确定内容的真实性,“在确定文档是否由 AI 生成时,检测结果可能会有所帮助,但不应成为*的证据。”
OpenAI在这个检测器里,使用了来自多个来源的 AI 生成的文本样本和人工编写的样本来训练模型。
AI 生成的文本样本方面,他们使用了包括 OpenAI在内的 5 个不同机构开发的 34 个模型生成的文本来进行训练。而人工编写的文本有三个来源,包括一个新的维基百科数据集、2019 年收集的WebText 数据集,以及训练InstructGPT时收集的部分数据。
OpenAI也对检测器在进行测试时的准确性进行了详细说明:
-大约 5% 的人工撰写的文本和 2% 的人工智能生成的文本,被判定为“非常不可能由 AI 生成”;
-大约 15% 的人工编写文本和 10% 的人工智能生成的文本,被归为“不太可能是 AI 生成”;
-大约 50% 的人工编写的文本和 34% 的人工智能生成的文本,被归为“不清楚是不是AI生成”;
-大约 -21% 的人工编写的文本和 28% 的人工智能生成的文本被归为“可能是 AI 生成”;
-大约 9% 的人工编写的文本和 26% 的人工智能生成的文本,被归为“可能由 AI 生成”。
可以看出来,想要靠这个检测器全部抓住AI枪手,可能真的有些困难了。
| 检测器成为刚需
正如前文所说的,ChatGPT在学校里已经如野火一般蔓延开来。一款简单易用的检测器成为老师们翘首以盼的东西。
早在OpenAI推出自己的检测器之前,一位年仅22岁的普林斯顿大学的学生Edward Tian,就自行开发了一款检测器——GPTZero。
同样的,用户只需将文本复制并粘贴到GPTZero中。检测器会从文本的复杂性、创造性和变化性几个方面来进行评估。然后,GPTZero 会给出一个分数,并最终得出一个结果:该文本是由 ChatGPT 生成的,还是由人类撰写的。
EdwardTian 主修计算机科学,辅修新闻学,他利用寒假的一部分时间创建了 GPTZero,可以“快速有效地”破译一篇文章是人类还是 ChatGPT 撰写的。他在Twitter上称,创建该机器人的动机是为了对抗他认为越来越多的 AI 剽窃行为。
图片来源:Twitter
为了确定文章是否由机器人编写,GPTZero 使用两个指标:“困惑度(Perplexity)”和“突发性(Burstiness)”。
一个指标是用困惑度衡量文本的复杂性。如果 GPTZero 对文本感到困惑,那么该文本具有很高的复杂性并且更有可能是人工编写的。然而,如果文本对机器人来说更熟悉——因为它已经接受过此类数据的训练——那么它的复杂性就会很低,因此更有可能是由 AI 生成的。
另外一个指标是用突发性比较句子的变化。人类倾向于以更大的突发性写作,例如会综合使用一些较长或复杂的句子与较短的句子,而AI 的句子往往更统一。
1 月 3 日,该网站上线,一周内立马就有超过 3万 人试用,以至于程序都崩溃了,更有超过 700 万人在 Twitter 上观看了演示视频。老师们也马上注意到这款工具,纷纷联系他。现在,他正在开发一款专为教育工作者设计的工具,已经有3.3万名教师加入了这款还未开发完成的工具的等待名单(waitlist)。
当然,EdwardTian 也承认,他的检测也并非百分之百准确,一些用户也报告了GPTZero检测的错误结果,不过他说他仍在努力提高模型的准确性。
开源 AI 社区Hugging Face 也推出了一种工具来检测文本是否由 GPT-2 创建。GPT-2 是用于开发 ChatGPT 的 AI 模型的早期版本。南卡罗来纳州的一位哲学教授用这个工具抓获了一名提交了 AI 编写的作业的学生。
OpenAI 自己也已表示将致力于从源头上提高AI生成文本的透明性。此前,OpenAI 专注于 AI 安全的研究员 Scott Aaronson 透露,他们已经在研究怎么用“不易察觉的秘密信号”,为 GPT 生成的文本“加水印”,以让人们识别其来源。
另外,根据新闻网站Neowin的消息,包括斯坦福大学在内的一些机构,联合提出一种名为DetectGPT的新方法,来区分AI生成的文章。
在相关网站上,该综述称,DetectGPT 的这种方法不需要训练单独的分类器、收集真实或生成的段落的数据集,或显式地为生成的文本加水印,就可以大检测一段文本是否为机器编写。
如果该综述为真,那很有可能人类终于可以再次抓住AI的小辫子,把主动权重新掌握在自己手中。
图片来源:https://ericmitchell.ai/detectgpt/
ChatGPT再进化
另外值得一提的是,道高一尺,魔高一丈。虽然不少机构和开发者开始推出“AI检测器”,但是与此同时,OpenAI也在继续推动ChatGPT的再进化,进一步补全ChatGPT的短板——数学。
本周,OpenAI推出了新版本的ChatGPT,表示经过更新,已经提升了准确性和真实性,以及数学能力,预计 ChatGPT 的最新更新将使其能够处理复杂的计算并提供更精确的答案。
此前,ChatGPT的数学饱受诟病,很多基础数学问题都会犯错,尤其是在犯了知名的“老婆说的都是对的”错误后,更是受到了全网群嘲。
在上一个版本中,有网友问它2+5等于几,一开始ChatGPT给出了正确的回答,但是在网友回复说“我老婆说是8”之后,ChatGPT飞快改口,说自己搞错了。
图片来源:Twitter
新版本发布后,至少这一点得到了纠正。
不过,新版本仍旧有不少错误。有记者问ChatGPT,奥尼尔和姚明谁更高,尽管给出了这两个人的正确身高,ChatGPT仍然会出错。有趣的是,这次在指出它的错误后,它会自行改正。
图片来源:searchenginejournal
可能一个明显的进步在于,ChatGPT 已经能够通过 SAT 的部分数学试题,而且一如既往地,回答神速:
图片来源: Twitter
看着它惊人的进化速度,究竟ChatGPT和它的检测器们,谁能跑的更快呢?
标签: 人工智能
您可能也感兴趣:
为您推荐
军队抽组医疗力量承担 武汉火神山医院医疗救治任务
同马来西亚总理马哈蒂尔通电话 创造更多合作成果,造福两国和两国人民。
构筑起疫情防控的严密防线
排行
- 腾龙股份股东王柳芳减持302.01万股 价格区间为14.81-15.90元/股
- 因个人资金需要 新泉股份实际控制人唐志华拟减持不超1124.54万股
- 信捷电气股东邹骏宇减持50万股 价格区间为60.41-67.50元/股
- 国家卫健委:湖北以30个省外新增病例17例
- 因自身资金需求 科森科技股东徐宁拟减持不超3.71万股公司股份
- 中公高科股东潘玉利减持50万股 价格区间为20-20.60元/股
- 多地患者治愈后“复阳” 对疫情防控提出新挑战 五大焦点权威解析
- “精诚合作,打赢这一仗!”
- 生态环境部:自1月20日以来全国已累计处置医疗废物12.3万吨 ...
- 承诺两年扭转乱象 银保监会加快推进意外险费率市场化改革 ...
精彩推送
- 用魔法打败魔法:抓住AI枪手,ChatGPT检测器千呼万唤始出来
- 世界播报:抖音内容产品负责人支颖转岗至TikTok,将负责产品等业务
- 同比增长11.2%!去年我国软件业务收入跃上10万亿元台阶
- 文娱市场,好久没这么热闹了
- 全球观速讯丨创三年新高!澳门1月博彩收入同比跳涨82.5%
- 云南省优化财政政策,助力高原特色农业产业发展
- 焦点热门:长沙首位度猛跌1.1个百分点!湖南强省会,竟然让长...
- 今亮点!反超杭州!武汉,回归了
- 61年来人口首次负增长,这5省却逆势增长,为啥江西最多?
- 焦点精选!顺丰聚集主业精益化管理实现质的有效提升,2022年...
- 开年首月制造业PMI升至50.1%,高技术制造业等景气水平改善
- GDP突破7200亿元 再上一个千亿台阶 南昌2022年经济运行“成...
- 世界播报:2022年上海实际使用外资239.56亿美元 同比增长0.4%
- 台湾2022年外销订单金额结束两年增长态势
- 焦点简讯:2023,风电大年?
- 天天视点!【厉害】汕头,狂飙!
- 前沿热点:招商宏观1月宏观经济预测:经济修复,通胀先行
- 【焦点热闻】工信部:去年我国软件业务收入跃上10万亿元台阶
- 世界最资讯丨活力中国图鉴|制造业回暖:1月PMI升至50.1%超预期
- “兔”飞猛进开新局|贵州:确保一季度经济起好步
- 观速讯丨要做「印尼版Shopify」,iSeller获1200万美元B轮融资
- 全球微速讯:青岛:2022年GDP同比增长3.9% 全市固定资产投资...
- 世界快报:小县城消费水平被低估
- 天天实时:英镑兑人民币的兑换率一览2023年2月1日查询
- 播报:张颂文夸了30多条微博,这座小城火了
- 2023年2月1日瑞士法郎兑人民币换率是多少?
- 环球播报:数藏平台「红图艺数」完成数500万A轮融资
- 环球速递!日元兑人民币换率是多少 2023年2月1日日元兑人民...
- 世界热点评!【新西兰元汇率】新西兰元兑人民币换率是多少2月1日
- 【港元汇率】2月1日港元人民币兑换率多少?本月港元走势如何?
- 微头条丨AI公司「Mad Street Den」获得3000万美元C轮融资
- 环球热文:2022下半年福建各地文旅新媒体传播力指数出炉!
- 去年福建规上工业增速东部地区居首
- 广西国家级经开区实现提档晋位
- 【热闻】潢川县统计局助企纾困 助推优化营商环境
- 2022年北京规上工业企业利润1980.9亿元
- 《狂飙》商业版图很“强”,谁才是赢家?
- 每日快报!开学收心啦!五个“时间”锦囊分享给家长和孩子
- 环球微速讯:十三妹定了!江苏各市2022年GDP排名最终版来了~
- 焦点速递!武汉2022年GDP为18866.43亿元,同比增4%
- 每日热闻!宏观:供需、信心全面改善 经济修复趋势不变
- 热点评!如何网上炒股票?网上炒股的步骤有哪些?
- 世界实时:植物怎么传播种子?植物传播种子的方法有哪些?
- 春节观察:短视频成不了新民俗
- 滚动:深圳有望新增两所本科高校
- 金银花如何种植?金银花的种植方法有哪些?
- 环球消息!中国1月财新制造业PMI微升至49.2 企业乐观度增至...
- 天天最新:蒙古的首都在哪?蒙古资料介绍
- 全球聚焦:植物保护和健康公司Enko完成C轮融资,斯道资本参投
- 养竹鼠有什么技术?竹鼠的主要病状有哪些?
- 川剧变脸是怎么做到的?川剧变脸介绍
- 天天头条:百亿BTK抑制剂市场纷争,可能的三种结果
- 通常月季花几月开花?月季花有哪些品种?
- 多地首套房贷利率进入“3”阶段 首付、二套认定等政策有望进...
- 环球今热点:坚果市场火热,为什么三只松鼠难挣钱?
- 【世界新要闻】年初展望:停止加息并不是紧缩政策的终点
- 环球观热点:瞄准新赛道 新兴产业“跑出”竞争力
- 【环球聚看点】猴子新皮肤6元多久出?猴子新皮肤怎么样?
- 世界简讯:君子兰烂根怎么处理?君子兰烂根的处理方法有哪些?
- 养蚕的蚕沙有什么作用?养蚕的蚕沙有哪些用处?
- 当前视点!茉莉花怎么种植?茉莉花的种植方法有哪些?
- 速递!史上第二赚的春节档,没有赢家
- 当前播报:折扣店、会员店……零售行业的这些创新大大方便了消...
- 外媒文章:中国经济崛起态势“不可阻挡”
- 世界要闻:海关总署:围绕外贸“稳规模、优结构”提前研判储...
- 当前热讯:无锡:2022年固定资产投资总量4073.5亿 社会消费...
- 无锡2022年实现地区生产总值14850.8亿元 同比增长3.0%
- 2022年珠海GDP首次突破4000亿,但仍未摆脱土地依赖症
- 环球热议:首次!中国时速200公里客运内燃动车组将出口阿联酋
- 【世界热闻】国君宏观1月PMI数据点评:经济修复将从需求端走...
- 全球观天下!预算收支未达标——2022年财政数据点评
- 去年工业企业利润 超8.4万亿同比降4%
- 全球视讯!长江宏观1月PMI数据点评:经济复苏正当时,消费之...
- 全球快讯:经济修复将从需求端走向供给端——2023年1月PMI数据点评
- 腾讯越来越摸不透米哈游了
- 当前快讯:马化腾的电商梦,全靠它了
- 焦点消息!科大讯飞盯上机器人,这是要对标小米、蔚蓝?
- 全球快讯:抖音开启王炸行动:收割3500亿
- 世界今日讯!年轻人春节错峰搞钱:半月赚2万
- 快消息!香港金管局:将稳定币相关活动纳入监管,期望两年内落实
- 环球快资讯:2022年工业企业利润结构有所改善
- 中国有望成为拉动2023世界经济的“火车头” 国际组织纷纷上...
- 全球通讯!1月PMI升至50.1%,中国经济正在复苏
- 统计局:多去世27万,超额死亡率2.66%,与新冠有关吗?春节后...
- 国泰君安:经济修复将从需求端走向供给端
- 全球速看:福建产业大盘稳后劲足 地区生产总值首次突破五万亿元
- 全球信息:“经济增长动力十足”(外媒看中国)
- 痛失“中西部非省会第一城”,这个城市终于醒了:今年GDP增速...
- 【天天新视野】全力拼经济,奋战开门红
- 全球看热讯:PMI重回扩张区间 经济景气水平明显回升
- 环球简讯:城市24小时 | 谁是第八座“外贸万亿之城”
- 最新消息:香港金管局最新发布
- 2022年GDP达2478亿元,雨花区如何持续保持高质量发展?
- 每日短讯:35.3亿美元!2022年四川外商直接投资规模居中西部第一
- 50.1%! 1月制造业PMI重回扩张区间
- “国家账本”曝光!土地财政熄火,地方赤字11.6万亿
- 春节后开工第一周,中国经济传来两个好消息
- 人口质量稳步提升 高质量发展动力足
- 全球快看:增加值首次突破5000亿元大关 深圳金融业再上新台阶
- 焦点简讯:深圳重磅发布!首次突破5000亿