278,968
次編輯
變更
互联网档案馆
,無編輯摘要
[[File:互联网档案馆.jpg|350px|缩略图|右|<big>互联网档案馆</big>[http://language.chinadaily.com.cn/news/attachement/jpg/site1/20110906/0013729e41a90fcfce1701.jpg 原图链接][http://language.chinadaily.com.cn/news/2011-09/06/content_13634010.htm 来自 中国日报网 的图片]]]
其 [[ 数据 ]] 是由自带的网络爬虫自动搜集的,其网站典藏档案馆网站时光机,抓取了超过1500亿的网页。
其年度预算约为1000万 [[ 美元 ]] ,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会。总部雇员只有数十人,大部分雇员工作于书籍扫描中心,在红木城也有 [[ 数据中心 ]] 。
该 [[ 数据库 ]] 是国际互联网保存联盟成员,2007年被加利福尼亚州选为官方指定 [[ 图书馆 ]] 。档案馆收集的数据是各种各样的。截止2015年年初,互联网档案馆共收录了2400款MS-DOS游戏。
==历史==
1996年,卡利(Brewster Kahle)在创建盈利性的Alexa Internet时同时也创立了互联网档案馆;同年10月开始收集存储数据。不过,直到2001年开发了“ [[ 时光机 ]] ”前,这些数据都无法访问。1999年末扩展收集范围。
2012年8月,宣布将在其现存的130万文件的下载选项中加 入BitTorrent 入[[BitTorrent]] 。因为通过两个文件数据中心协调,这成为从该档案馆下载数据的最快方法。
2013年11月6日,档案馆在里奇蒙德区的总部失火,损坏了许多设备和一些附近的公寓,预计损失达到60万美元。
==收集书目==
互联网档案馆收集了世界各地的数字化图书以及各大图书馆和 [[ 文化遗产 ]] 机构的特殊藏品。互联网档案馆在5个 [[ 国家 ]] 经营着33个图书扫描中心,其活动受图书馆和基金会的财政支持。截至2013年7月,档案馆共收集了440万本书,每月的下载量超过1500万。截至2008年11月,档案馆共有100万个网络文本,总大小高达0.5PB,涵盖了原始照相图像、裁剪和歪斜的 [[ 图像 ]] 、PDF文件和原始OCR数据。