人工智能初创公司OpenAI称其正在测试基于GPT-4的内容审核系统,有望大幅缩短内容审核时间。
当地时间8月15日,OpenAI在官网上发布文章称,将GPT-4用于内容策略开发和内容审核决策的测试已经取得了很好的效果,能够实现更一致的标签、更快的策略优化反馈闭环,并减少人工审核人员的参与。OpenAI认为,GPT-4内容审核工具可以帮助公司在一天内完成大约六个月的工作。
OpenAI表示,内容审核向来是一项既耗时又具有挑战性的工作,需要很高的细致度、敏感度、对语境的深刻理解和对新案例的快速适应,还会对人工审核人员造成情绪负担。通常,内容策略中的变更由于需要大量人力介入调整,往往要经过数月才能落实到整个系统,而作为大型语言模型(LLM)的GPT-4可以将这一过程从数月缩短到数小时。
在具体的训练过程中,制定好策略指南后,策略专家就可以通过识别少量示例、为其分配标签来创建一组黄金数据。然后,GPT-4会读取策略指南,并在看不到答案的前提下为同一数据集分配标签,由专家来检查这些标签是否分配正确。
策略专家还可以要求GPT-4给出标签背后的推理,分析策略指南中可能存在的歧义,并在指南中做出相应澄清。这些步骤可以被不断重复,直到对AI审核的质量感到满意。
另外,为了大规模地处理大量数据,可以在正式处理前先使用GPT-4的预测功能来微调一个较小的模型。
OpenAI一直在对该技术进行测试,也欢迎用户加入训练。任何拥有OpenAI API访问权限的人都可以采用这种方法来创建自己的人工智能辅助审核系统。
不过,OpenAI承认GPT-4的标记质量与经过轻度训练的人类审核员相似,但与经验丰富、训练有素的人类审核员相比仍有差距。对此,OpenAI强调,审核的过程不应该完全自动化。在新的内容审核系统中AI仍然需要人的领导。
值得一提的是,在此之前,已经有多款由AI驱动的审核工具面世,其中较为出名的是谷歌(Google)的Perspective API,由谷歌反滥用技术团队和Jigsaw联合开发,被包括Reddit论坛、《纽约时报》和《金融时报》在内的一系列世界著名发布商、平台和研究机构所使用。
不过,比起运用审核工具,许多企业仍然选择将审核工作完全外包给其他人力公司来节省研究成本。据《华尔街日报》7月24日报道,在过去的几年,OpenAI自己就为了清洗ChatGPT的数据雇佣了大量来自肯尼亚的廉价劳工。
而就在一周前的8月10日,印度媒体Analytics India Magazine刚发布了惊人的推论,称OpenAI可能会在2024年底破产,因为仅仅运营ChatGPT,OpenAI每天的成本就高达70万美元,马斯克新成立的xAI和GPU短缺问题更是为还没有盈利的OpenAI雪上加霜。
据网站数据分析工具SimilarWeb调查显示,ChatGPT访问量增长率在过去几个月内一直在下滑,7月份的用户数量为15亿,环比下降了12%。
今年1月底,OpenAI曾推出一款AI工具AI-Text-Classifier(AI文本分类器),旨在用来识别由AI生成的文本内容。不过,在诞生还不满半年后,这个新AI工具就在今年7月被OpenAI以“准确率太低”为由关停了。