16学者评【AI与现代战争】第9篇
OpenAI在去年多次重磅推出文字生成的人工智能之后,今年开年又推出了可以输入文字生成短视频的SORA,颇有一夜之间就要取缔一整个行业的架势。人工智能无论是在娱乐领域还是军事领域,其背后依赖的是对数据做大量的训练。无论是文字还是图片素材(或者由图片结合出来的视频素材),当前都仍然需要回归到对文字和文字标签的处理。随后,在对生成过程的路径进行训练后,模型就会越来越贴合最初输入的指令。可以说,SORA之所以能如此令人眼前一亮,是因为OpenAI已经有了强大的自然语言处理能力做基础。
按照这样的思路分析,要在人工智能领域取得主动权,获得竞争力,原始数据必须数量大、质量高,数据在被训练的时候不能有太多干预和忌讳,最终的结果不能被系统性地审查。如果一个社会在言语和图片上充满着禁忌,有的时候连文字的谐音、图像的类比都不被允许,那不仅被用于训练的数据质量会有缺陷,模型生成过程的路径以及神经网络的完整性显然都会不尽如人意。可谓自废武功。
在商业层面,其实OpenAI所用的核心方法来自于谷歌的几篇论文(尤其是关于diffusion transformer的)。但谷歌可能因为流程繁冗,条条框框的规矩(比如涉及隐私的)非常多,整个“机器”就转得很慢。而OpenAI作为初创公司,小而精让其没有太多的包袱,它的灵活性让创新力得到了极大的发挥。在我们中国的大背景下,这意味着可能既要避免负重前行的国企对资源的垄断,也要避免行业巨头对流量和市场的霸占,让小而精的公司既可以随时用互联网(在不受阻挠的情况下)查看重要的论文,也可以拥有高质量的全面数据。
人工智能领域的竞争其实是中国维新的一次契机。拿旧金山这个城市举例,因为硅谷生活成本高昂以及此前疫情期间网上办公导致的实体经济受到重大冲击,再加上城市核心区域常年有流浪群体聚居及治安问题,很多人才最近几年出现纷纷撤离的趋势。旧金山作为一个美国西海岸的重要城市在前几年遇到了巨大的挑战。但最近因为人工智能公司的扎堆及其带来的规模效应,旧金山的虚拟和实体经济又出现了复苏反弹的迹象。城市状况也与前几年相比有了改善。这种“旧金山模式”显然可以被用于海南、香港等地,贴合国家的大政方针的同时,让人工智能这个新兴产业为这些地区的再次腾飞推波助澜。
中国是个超级大国,大家都清楚让整搜航母调整方向会非常困难且耗时。但以海南、香港这样的本就有土壤和政策红利的“特区”进行开放社会的尝试,显然能起到“牵引”而“四两拨千斤”的作用。人工智能时代,技术的发展和迭代会越来越快,颠覆性的产品及相关应用也会层出不穷。如果起跑时就一直只能有比别人低一截的加速度,那注定是跑不过而且差距会越来越大的。而决定这个加速度的关键除了人才的培养和资源的投入以外,显然离不开一个开放社会所创造的良好环境以及其带来的数据、信息相关的红利。