亚洲欧洲精品专线,国内少妇毛片视频,日本一区二区三区高清无卡,香蕉久久久久久AV综合网成人

GitHub實(shí)施更嚴(yán)格的風(fēng)控規(guī)則阻止中文用戶訪問 疑似是為了反爬蟲和反抓取

業(yè)界 來源:藍(lán)點(diǎn)網(wǎng) 2025-05-01 09:59:32

早前 GitHub 因?yàn)槭д`部署了屏蔽所有中國 IP 地址的規(guī)則,中國 IP 地址訪問時(shí)會(huì)出現(xiàn)禁止訪問提示,隨后 GitHub 更新規(guī)則并解釋是部署錯(cuò)誤,更新規(guī)則后中國 IP 地址可以重新訪問。

如果之前是失誤那現(xiàn)在肯定就是故意的了,GitHub 部署的新規(guī)則會(huì)對用戶語言進(jìn)行檢查,如果用戶使用的是中文 (僅限 zh_CN) 則可能會(huì)觸發(fā)限制而被限制訪問,不過從情況來看 GitHub 應(yīng)該是為了反爬蟲的 (例如某 SDN 無差別拉取 GitHub 上的項(xiàng)目搬到自家平臺(tái))。

從測試情況來看 GitHub 將多個(gè)條件整合用來觸發(fā)限制,例如首先檢查 GitHub 的常規(guī)規(guī)則 (包括黑名單 IP 和 UA),然后檢測 IP 地址質(zhì)量,以上兩個(gè)條件全部通過后再檢查第三個(gè)條件,也就是瀏覽器請求頭的語言部分是否包含 zh_CN,如果檢測到用戶使用的中文則會(huì)返回錯(cuò)誤。

也就是說 GitHub 并沒有針對特定區(qū)域的 IP 進(jìn)行封禁,如果用戶 IP 質(zhì)量沒問題的話則不會(huì)觸發(fā)語言檢測,因此如果用戶使用企業(yè)代理軟件訪問 GitHub 的話就可能因?yàn)?IP 地址質(zhì)量差 (臟 IP) 而觸發(fā)語言檢測。

從這些情況來看 GitHub 大概率是為了反爬蟲和反抓取,目前大量 AI 爬蟲對 GitHub 瘋狂抓取用來訓(xùn)練模型,這種抓取行為不僅會(huì)給 GitHub 服務(wù)器造成負(fù)擔(dān),也會(huì)浪費(fèi)大量流量造成 GitHub 成本增加。

如果用戶并非爬蟲并且訪問受到影響,那也可以進(jìn)行針對性的解決:

1. 簡單方法就是直接修改請求頭將語言修改為 en_US 等其他未被限制的語言

2. 更換質(zhì)量更好的 IP 地址避免觸發(fā)風(fēng)控,當(dāng)然更換 IP 地址可能會(huì)增加潛在使用成本

不過針對語言的檢測很容易被繞過,接下來 GitHub 很有可能會(huì)觀察情況并對修改語言的行為進(jìn)行檢測,畢竟反爬蟲是個(gè)長期工作,GitHub 也只能根據(jù)爬蟲的情況進(jìn)行針對性的策略調(diào)整實(shí)現(xiàn)封禁。

延伸閱讀

關(guān)注公眾號(hào):拾黑(shiheibook)了解更多

友情鏈接:

關(guān)注數(shù)據(jù)與安全,洞悉企業(yè)級(jí)服務(wù)市場:https://www.ijiandao.com/
安全、綠色軟件下載就上極速下載站:https://www.yaorank.com/

公眾號(hào) 關(guān)注網(wǎng)絡(luò)尖刀微信公眾號(hào)
隨時(shí)掌握互聯(lián)網(wǎng)精彩
贊助鏈接