有人整理了一份“未被AI污染的”信息资源,搜集了2022年以前,ChatGPT还未诞生前的网络信息,做成一个类似数字避难所的网页。传送门在这:lowbackgroundsteel.ai 该网页的初衷很简单:生成式AI诞生之前,网络上的内容都是人写的。那时候的文字、图片、代码,没有经过AI生成,这些都是“宝藏”级别的原生态资源。 具体来说,该网页搜集了以下信息: - 包括旧版Wikipedia快照、Project Gutenberg的公共领域书籍、GitHub的Arctic Code Vault归档代码等; - 用户还能自行投稿推荐,补全更丰富的“干净数据”。 这个项目就像是信息时代的一个“时空胶囊”,保存人类内容创作的原始切片。
有人整理了一份“未被AI污染的”信息资源,搜集了2022年以前,ChatGPT还
量子位来谈科技
2025-06-12 18:24:27
0
阅读:1