极客日报 #1764
极客日报#1764
本期收录 3 条社区推荐,涉及 Datafaker - Java fake data generator、Roman Storm:他们想要摧毁的开发者、来自哈佛的百万本优质图书数据集,训练你的AI必备开源数据。
2025年6月23日
本期推荐
Datafaker - Java fake data generator
一个用于跨多个类别(如姓名、地址和财务记录)生成逼真测试数据的现代 Java 库。需要 Java 17+。
Roman Storm:他们想要摧毁的开发者
随着 2025 年 7 月 14 日审判日期的临近,利害关系变得清晰。审判的关键在于陪审员是否理解创建软件与控制服务之间的区别。检察官能否说服他们斯托姆是在经营一家企业,而非发布开源代码?
来自哈佛的百万本优质图书数据集,训练你的AI必备开源数据
Institutional Books 1.0: A 242B token dataset from Harvard Library's collections, refined for accuracy and usability
Rebase 极客日报由社区志愿者共同维护,持续整理值得关注的技术内容与行业信号。