21,453
次編輯
變更
失效链接
,無編輯摘要
{{How-to|WP:BADLINK|WP:DEADLINK|WP:LINKROT|WP:ROT}}
{{nutshell|失效 链接对 連結對 百科全 书来说 書來說 並不是 个 個 威 胁 脅 ,但是 采 採 取下面的步 骤 驟 可以降低它的影 响 響 。}}
{{NoteTA
|G1 = IT
|G2 = MediaWiki
}}
同多 数 數 大型[[ 网 網 站]]一 样 樣 , 维基 維琪 百科也 时 時 常遭遇'''失效 链接連結''' 这 這 一 现 現 象,即常用作 参 參 考和引用的外部 链接 連結 ,由 于 於 所引用的 网 網 站消失、 变 變 更 内 內 容或者移 动 動 , 导 導 致 内 內 容 变 變 得不相 关 關 或者 链接 連結 直接 损坏 損壞 。 这对维基 這對維琪 百科的[[Wikipedia:可靠 来 來 源|可靠性]]和[[Wikipedia:列明 来 來 源|列明 来 來 源]]的要求 来说 來說 ,是 个极 個極 大的威 胁 脅 。
防止失效 链接显 連結顯 然比修 复 復 或 减 減 少失效 链接 連結 要容易的多。因此, 对于 對於 失效 链接 連結 的防止''' 巩 鞏 固了'''百科全 书 書 。 该 該 指 导给 導給 出了 预 預 防失效 链接 連結 的一些策略。 这 這 其中包括使用 网络 網路 存 档 檔 服 务 務 ,以及 审 審 慎的使用引用 模板 範本 。
但是,失效 链接 連結 不可能完全被根除,因此 该 該 指引 还给 還給 出如何 减 減 少失效 链接 連結 的方法,如 寻 尋 找之前的存 档链接 檔連結 和使用替代 来 來 源。
''' 请 請 不要 仅仅 僅僅 因 为来 為來 源 链接 連結 失效,就 删 刪 除事 实 實 性的 信息 資訊 。''' [[Wikipedia:可供查證]]方 针并没 針並沒 有要求所有 信息 資訊 都有未失效 链接 連結 佐 证 證 ,也 没 沒 有要求 来 來 源必 须来 須來 自 网络 網路 。
除了在[[Wikipedia:外部 链接連結|外部 链接連結]]部分,未用 来 來 支 持条 援條 目 内 內 容的 网 網 址外,'''不要 仅仅 僅僅 因 为网 為網 址失效,就 删 刪 除它'''。有相 关 關 的 复 復 原、修 复选项 復選項 和工具。
== 防止 链接 連結 失效 == 当 當 你[[Wikipedia:改進條目|撰 写条 寫條 目 时時]],可以 采 採 取多 种 種 方式防止 链接 連結 失效。首先,你可以 尽 盡 可能多的使用引用 模板 範本 中的 参数 參數 , 记录参 記錄參 考的作者、 来 來 源、出版者、 发布 發佈 日期等 信息 資訊 ,而不是 简单 簡單 的放置一 个链接 個連結 。如果 将来链接 將來連結 失效, 这 這 些 额 額 外的 信息 資訊 可以 帮助 説明 其他 维基 維琪 百科人( 编 編 者或 读 讀 者)找到原始文本的新 来 來 源, 无论 無論 是 来 來 自 网络还 網路還 是印刷 资 資 料。如果只有一 个简单 個簡單 的URL 地 位 址, 这 這 就不太可能了。本地或者 学 學 校的 图书馆 圖書館 是 寻 尋 找 线 線 下 信息 資訊 的好去 处 處 。 许 許 多 当 當 地 图书馆 圖書館 有室 内 內 的查 阅处 閱處 ,或者 电 電 子 数据库 資料庫 、 馆内 館內 借 阅协议 閱協議 , 这样 這樣 一些 难 難 以查找的 来 來 源 变 變 得更易取得。
=== 网络 網路 存 档 檔 服 务 務 ===[[網際網路檔案館| 网络 網路 存 档檔]]服 务 務 可以存 档网页 檔網頁 的目前 状态 狀態 ,供以 后 後 查 阅 閱 。最常用的服 务 務 有:[https://web.archive.org Wayback Machine]( 经 經 常自行主 动 動 抓取)、[http://www.webcitation.org/ WebCite],和[https://archive.fo/ archive.is]。 这 這 三 个 個 服 务 務 都可以按 使 用 户请 者請 求保存 页 頁 面。此外,搜尋引擎提供的[[頁庫存檔]]功能也能用來存取某些失效連結,不過需注意搜尋引擎也會定期清除放置過久的網頁存檔。 这 這 些服 务 務 都在收集和存 储网络页 儲網路頁 面,以防 将来 將來 原 页 頁 面被移 动 動 、修改、 删 刪 除或者需要付 费访问 費訪問 。 当 當 引用 页 頁 面 极为 極為 不 稳 穩 定或者 时 時 常 变动时 變動時 ,比如 时 時 效性很 强 強 的[[新 闻聞]] 报道 報導 或者 财务 財務 困 难 難 的公司支 持 援 的 页 頁 面, 网络 網路 存 档 檔 的重要性愈 发 發 凸 显 顯 。一旦你找到了 网络页 網路頁 面的存 档网络地 檔網路位 址,只需要在引用 模板 範本 中加入<code>archive-url=</code>和<code>archive-date=</code> 参数标 參數標 明存 档 檔 的URL和存 档时间 檔時間 即可。 模板会 範本會 自 动将 動將 存 档链接 檔連結 加入到 参 參 考中。
例如:
*{{cite web |url=http://freakonomics.blogs.nytimes.com/2008/01/24/wall-street-journal-paywall-sturdier-than-suspected/?scp=1-b&sq=paywall&st=nyt|title=Wall Street Journal Paywall Sturdier Than Suspected |last=Dubner|first=Stephen J. |publisher=The New York Times Company|date=January 24, 2008|accessdate=2009-10-28}}
*{{cite web |url=http://freakonomics.blogs.nytimes.com/2008/01/24/wall-street-journal-paywall-sturdier-than-suspected/?scp=1-b&sq=paywall&st=nyt|title=Wall Street Journal Paywall Sturdier Than Suspected |last=Dubner|first=Stephen J. |publisher=The New York Times Company|date=January 24, 2008|accessdate=2009-10-28|archiveurl=http://web.archive.org/web/20080430085418/http://freakonomics.blogs.nytimes.com/2008/01/24/wall-street-journal-paywall-sturdier-than-suspected/|archivedate=2008-04-30}}
不 过 過 , 并 並 不是所有的 网络页 網路頁 面都可以存 档 檔 。 网络 網路系統 管理 员 員 或者出版商可能 会 會 使用[[Robots.txt]]拒 绝 絕 存 档 檔 ,或者用 复杂 複雜 的[[JavaScript]]、[[Adobe Flash|flash]]和其他代 码 碼 使得 页 頁 面 内 內 容 难 難 以 轻 輕 易被 复制 複製 。在此 种 種 情 况 況 下,可以 采 採 用存 储数据 儲資料 的替代方案。
{{HideH| 网页 網頁 存 档 檔 服 务对 務對 比}}==== 网页 網頁 存 档 檔 服 务对 務對 比 ====以下列出上面提到的三 个 個 存 档 檔 服 务 務 的 详细 詳細 特 征 徵 。“ 书签 書簽 ”提供一 个 個 便 于 於 使用的[[ 书签 書簽 小程 序式]],“格式”提供URL存 档 檔 格式,而“存在” 则给 則給 出如何 构 構 造URL 寻 尋 找已有 链接 連結 的存 档 檔 。
* [[Wayback Machine]],[[WP:WAYBACK]]
** ''' 书签書簽''':<code><nowiki>javascript:void(open('https://web.archive.org/save/'+document.location))</nowiki></code>
** '''格式''':<code><nowiki>https://archive.org/web/YYYYMMDDHHMMS/URL</nowiki></code>
** '''存在''':<code><nowiki>https://archive.org/web/*/URL</nowiki></code>(也可以使用 通配符 萬用字元 * 匹配 URL 前缀 首碼 );bot可使用[https://archive.org/help/wayback_api.php API]。** 支持 HTML、PDF 和 纯 純 文 本 字 等多 种 種 格式,另有一 个 個 通用的存 档库 檔庫 可以自行上 载文件 載檔 。** 具有主 动 動 爬 虫 蟲 功能,抓取和 访问 訪問 均受 robots.txt 限制(因此已 经 經 抓取的 页 頁 面也可能 无 無 法 访问 訪問 )。
* {{tsl|en|WebCite}},[[WP:WEBCITE]]
** ''' 书签書簽''':<code><nowiki>javascript:void(open('http://www.webcitation.org/archive?url='+encodeURIComponent(document.location)+'&email=USER_EMAIL_HERE'))</nowiki></code>*** 请 請 在 实际 實際 使用 时将時將<code>USER_EMAIL_HERE</code>改 为实际邮件 為實際郵寄 地址。
** '''格式''':<code><nowiki>http://www.webcitation.org/query?url=URIEncode(URL)&date=YYYY-MM-DD</nowiki></code>
** '''存在''':按格式 请 請 求,但不指定日期。** 处 處 理完成 后会发 後會發 送 邮 郵 件到指定的 邮件 郵寄 地址。 仅 僅 在抓取 时 時 受 robots.txt 限制。
* [[archive.is]],{{tsl|en|WP:ARCHIVEIS}}
** ''' 书签書簽''':<code><nowiki>javascript:void(open('https://archive.fo/?run=1&url='+encodeURIComponent(document.location)))</nowiki></code>** '''格式''':<code><nowiki>http://archive.is/URL</nowiki></code>; <code><nowiki>http://archive.is/ 时间時間/URL</nowiki></code> [https://archive.fo/faq#How_to_refer_to_the_saved_page__ 时间 時間 格式]*** 注意 archive.is 会对于 會對於 URL 的不同 #fragment 后缀 尾碼 分 开 開 看待。** '''存在''': 对 對 URL 使用不 带时间 帶時間 的格式;另可以使用 通配符 萬用字元 * 匹配子 域 功能變數 名 稱 和 URL 前缀 首碼 。 对Bot 對Bot 支持Memento Project API。** 支 持 援 HTML 和 纯 純 文 本 字 ,保存 样 樣 式、 图 圖 像、 脚 腳 本和 网页 網頁 截 图 圖 ,以及保存 脚 腳 本 请 請 求的 内 內 容。不支持 PDF,存 档 檔 大小限制 50M。** 能 够将经 夠將經 由 webcache 或其他存 档 檔 服 务 務 商存 档 檔 的 内 內 容分 进 進 原 页 頁 面的存 档列表 檔清單 , 适 適 合在原始 资 資 料 刚刚 剛剛 消失但 还 還 能在 网页 網頁 快照中找到 时 時 使用。** archive.is 会 會 不 带帶"robot" 标签 標籤 抓取 内 內 容,因此 对于 對於 在美 国拥 國擁 有版 权 權 的 内 內 容可能 构 構 成未 经许 經許 可 转载 轉載 ,以至 于违 於違 反[[DMCA]]。 对于这 對於這 些 内 內 容 请谨 請謹 慎使用。
{{HideF}}
=== 可替代方案 ===
大多 数 數 引用 模板里 範本裡 含有<code>quote=</code> 参数 參數 ,此 参数 參數 用 来 來 存放 从来 從來 源材料中引用的少量文本。 这对于没 這對於沒 有 网络 網路 存 档 檔 可用的 来 來 源 极 極 其有用, 这 這 亦可防患 选 選 定的 网络 網路 存 档 檔 服 务 務 出 现问题 現問題 。
例如:
*{{cite web |url=http://freakonomics.blogs.nytimes.com/2008/01/24/wall-street-journal-paywall-sturdier-than-suspected/?scp=1-b&sq=paywall&st=nyt|title=Wall Street Journal Paywall Sturdier Than Suspected |last=Dubner|first=Stephen J. |publisher=The New York Times Company|date=January 24, 2008|accessdate=2009-10-28|archiveurl=http://web.archive.org/web/20080430085418/http://freakonomics.blogs.nytimes.com/2008/01/24/wall-street-journal-paywall-sturdier-than-suspected/|archivedate=2008-04-30|quote=''...the Wall Street Journal will not, as has been widely speculated, tear down its paywall entirely...''}}
引述文本也可以在原 来 來 源消失的 时 時 候, 帮 幫 助其他人更方便的 寻 尋 找其他 在线 線上 版本 来 來 源。
如果可用的 话 話 ,[[Wikipedia:公有 领 領 域|公有 领 領 域]]的材料可以放置到[[ 维基 維琪 文 库庫]]中。
== 修 复 復 失效 链接 連結 == 还 還 有很多方法可以修 复 復 失效 链接 連結 。一般 来说 來說 , 网页 網頁 因 为迁 為遷 移到新的 伺 服 务 器上,或是 網 站 点维护会 維護會 被移 动 動 。 网 網 站目 录 錄 可以 帮 幫 你方便的查找到移 动 動 的 页 頁 面。在搜 索 尋 引擎中 对 對 站 内进 內進 行 标题 標題 查找,也可能 会 會 找到 该页 該頁 。例如上例,可以使用[[Google]] 这样 這樣 搜索:<nowiki>site:http://freakonomics.blogs.nytimes.com/ "Wall Street Journal Paywall Sturdier Than Suspected"</nowiki>
如果 这样还 這樣還 不行, 请 請 前往存 档 檔 服 务寻 務尋 找 该页 該頁 的存 档 檔 版本。
== 减 減 少失效 链接 連結 ==有 时 時 ,所有修 复链接 復連結 的 尝试 嘗試 都 会 會 以失 败 敗 告 终 終 。此 种 種 情 况 況 下, 请 請 考 虑寻 慮尋 找替代 来 來 源替 换 換 之前的失效 链接 連結 , 这样 這樣 就不至 于 於 影 响 響 到 条 條 目的可查 证 證 性。有 关 關 常 见话题 見話題 的替代 来 來 源十分容易 寻 尋 找。可能只需要 简单 簡單 的使用搜 索 尋 引擎查 询 詢 一下,就能 够 夠 找到一 个 個 合 适 適 的替代 来 來 源,但是 请 請 特 别 別 注意,不要引用 维基 維琪 百科及其 镜 鏡 像 網 站 点 的 内 內 容, 这将 這將 有 损損[[Wikipedia:可供查 证證|可供查 证證]]的原 则 則 。
但是有的 时 時 候 无 無 法找到合 适 適 的替代 来 來 源,或者需要付出更多的查找精力,例如前往 图书馆 圖書館 或者使用基 于 於 描述的 数据库 資料庫 。在此 种 種 情 况 況 下,可以前往[[Wikipedia:互助客 栈棧]] 询问 詢問 其他 维基 維琪 百科 编 編 者。或者,你也可以 尝试联系专 嘗試聯繫專 家,或者 对与 對與 之相 关专题 關專題 有 兴 興 趣的 编 編 者。
== 保留失效 链接 連結 ==一 个 個 失效、未存 档 檔 的 链接 連結 可能 还 還 有用 处 處 。 这样 這樣 的 链接 連結 至少意味 着 著 ,相 关信息 關資訊 (可能) 过 過 去曾 经 經 是可供查 证 證 的,而此 链接 連結 可能提供 给 給 有更多 资 資 源或更 为专业 為專業 的 使 用 户 者 足 够 夠 多的 信息 資訊 去 寻 尋 找 参 參 考 资 資 料。而且失效 链接 連結 可能 会 會 自行恢 复 復 。有了失效 链接 連結 ,也可以查出它是否在其他地方被引用 过 過 ,或者可以 联系该来 聯繫該來 源的最初 负责 負責 人。例如,如果 http://www.cs.yale.edu/~EliYale/Defense-in-Depth-PhD-thesis.pdf{{dead link}} 失效,那 么编 麼編 者可以 联系 聯繫 耶 鲁 魯 大 学计算机 學電腦 科 学 學 部 门 門 。 请 請 直接在失效 链接后 連結後 放置{{tl|dead link}} 模板进 範本進 行 标识 標識 。
== 参见 參見 ==
* [[Wikipedia:CHECKLINKS]]
* [http://dispenser.info.tm/~dispenser/view/Checklinks Checklinks],一 个 個 可用的 编辑編輯[[m:Toolserver|工具]],能 够 夠 列出失效 链接并 連結並 使用存 档 檔 服 务进 務進 行恢 复 復 。* [[m:weblinkchecker.py|weblinkchecker.py]], 来 來 自[[m:Using the python wikipediabot|Python Wikipedia Bot 类類]]的 脚 腳 本,能 够寻 夠尋 找 并报 並報 告 无 無 法使用的外部 链接 連結 。* [[Wikipedia:外部 链接連結#遇到失效 链接 連結 怎 么办 麼辦 ?]]* [[HTTP 状态码狀態碼]]* [[:Category: 带 帶 有失效 链接 連結 的 条 條 目]]
* [[m:InternetArchiveBot]]
{{Wikipedia essays|building}}
[[Category: 维基 維琪 百科 维护維護|{{PAGENAME}}]]