一、對(duì)于大流量的網(wǎng)站解決各頁(yè)面訪問(wèn)量統(tǒng)計(jì)問(wèn)題的方法
1、使用日志分析工具
日志分析工具可以記錄每一個(gè)用戶訪問(wèn)網(wǎng)站的請(qǐng)求,并根據(jù)相應(yīng)的日志信息生成報(bào)告。這種方法可以幫助網(wǎng)站管理員了解哪些頁(yè)面被訪問(wèn)非常多、哪些頁(yè)面被訪問(wèn)時(shí)長(zhǎng)最長(zhǎng)等關(guān)鍵指標(biāo)。
2、使用計(jì)數(shù)器
計(jì)數(shù)器是一種簡(jiǎn)單的工具,可以記錄一個(gè)頁(yè)面被訪問(wèn)的次數(shù)。但是,計(jì)數(shù)器的數(shù)據(jù)可能不夠精確,因?yàn)橛行┯脩艨赡苁褂貌煌脑O(shè)備或者瀏覽器訪問(wèn)同一個(gè)頁(yè)面。
3、使用JavaScript代碼
使用JavaScript代碼:通過(guò)添加JavaScript代碼到網(wǎng)站上,可以記錄每一次頁(yè)面被訪問(wèn)的信息。這種方法可以識(shí)別不同的用戶和設(shè)備,并提供更準(zhǔn)確的數(shù)據(jù)統(tǒng)計(jì)。
4、使用分布式緩存
使用分布式緩存:當(dāng)網(wǎng)站流量非常大時(shí),通常需要使用分布式緩存來(lái)存儲(chǔ)和處理訪問(wèn)量數(shù)據(jù)。這種方法可以提高網(wǎng)站的性能和可擴(kuò)展性,并且可以支持多個(gè)數(shù)據(jù)源和不同的數(shù)據(jù)格式。
二、免費(fèi)開(kāi)源的網(wǎng)站流量分析統(tǒng)計(jì)工具
1、Umami
Umami 是一個(gè)簡(jiǎn)單易用、自托管的開(kāi)源(基于 MIT 協(xié)議)網(wǎng)站訪問(wèn)統(tǒng)計(jì)分析工具。Umami 不使用 Cookie,不跟蹤用戶,且所有收集的數(shù)據(jù)都會(huì)匿名化處理,符合 GDPR,資源占用很低,雖然功能簡(jiǎn)單,但分析的數(shù)據(jù)內(nèi)容很豐富,基本的來(lái)源國(guó)家,來(lái)源域名,使用的瀏覽器、系統(tǒng)、設(shè)備,訪問(wèn)的網(wǎng)頁(yè)這些都有,還支持多國(guó)語(yǔ)言。
2、Shynet
Shynet 是自建的、開(kāi)源的(基于 Apache-2.0 協(xié)議)網(wǎng)站統(tǒng)計(jì)分析工具,它在沒(méi)有 Cookie 的情況下工作,不會(huì)像其它公共統(tǒng)計(jì)工具一樣追蹤你的訪客,它只收集足夠有用的數(shù)據(jù)。同時(shí)可以不使用 Javascript 運(yùn)行,分析腳本十分輕量,不到 1kb。
不過(guò) Shynet 并不適合所有人,它非常適合個(gè)人項(xiàng)目和中小型網(wǎng)站,但尚未在高流量網(wǎng)站上進(jìn)行測(cè)試。因此還需要大量的不斷的維護(hù)升級(jí),因此如果您需要一鍵式解決方案,較好使用其他工具。
3、Plausible
Plausible Analytics 是一個(gè) 100% 開(kāi)源的(基于 AGPL-3.0 協(xié)議)輕量化網(wǎng)站統(tǒng)計(jì)分析工具。網(wǎng)站所有者獲得一些可操作的數(shù)據(jù)來(lái)幫助他們學(xué)習(xí)和改進(jìn),同時(shí)不會(huì)使用 Cookie,沒(méi)有跨站點(diǎn)或跨設(shè)備跟蹤,也不會(huì)收集個(gè)人數(shù)據(jù),并且完全符合 GDPR、CCPA 和 PECR 等隱私政策。
Plausible Analytics Cloud 默認(rèn)是收費(fèi)的版本,采用訂閱制,直接托管在官方的服務(wù)器上,不需要自己搭建。但是也可以選擇免費(fèi)自建方案,自建的版本功能也很完善,只是發(fā)布頻率較低,每半年才會(huì)整合更新一次。
4、Fathom
Fathom Analytics 是一個(gè)更簡(jiǎn)單、注重隱私的 Google Analytics 替代方案。Fathom 尊重用戶的隱私,不會(huì)收集任何個(gè)人身份信息。同時(shí)為用戶提供有關(guān)網(wǎng)站的所需信息。
Fathom 也有 Lite 和 Pro 版本,Pro 版本和上面的一樣,采用付費(fèi)訂閱制,不使用 Cookie;而 Lite 版本是免費(fèi)開(kāi)源的(基于 MIT 協(xié)議),可以自己搭建,但是目前不符合 PECR,因?yàn)樗褂媚涿?Cookie,同時(shí) Lite 版本相比 Pro 版本,分析的數(shù)據(jù)很少,只有上圖中的基礎(chǔ)數(shù)據(jù),沒(méi)有語(yǔ)言、來(lái)源位置、設(shè)備分析等數(shù)據(jù)。
5、Ackee
Ackee 是一個(gè)關(guān)注隱私的開(kāi)源(基于 MIT 協(xié)議)自建分析工具,采用輕量級(jí)的 Node.js 和 MongoDB 架構(gòu)。Ackee 界面簡(jiǎn)潔美觀,采用匿名數(shù)據(jù)采集的方式,分析你網(wǎng)站的流量并在最小的界面中提供有用的統(tǒng)計(jì)信息。對(duì)于不需要像 Google Analytics 或 Matomo 這樣的全功能營(yíng)銷分析平臺(tái)的個(gè)人來(lái)說(shuō),是一款非常不錯(cuò)的工具。
三、對(duì)于大流量的網(wǎng)站解決訪問(wèn)量問(wèn)題的方法
確定當(dāng)前服務(wù)器設(shè)備是否滿足流量需求。使用Memcache緩存技術(shù),把動(dòng)態(tài)內(nèi)容緩存到文件中,動(dòng)態(tài)網(wǎng)頁(yè)直接調(diào)用這些文件,而不必再訪問(wèn)數(shù)據(jù)庫(kù)。禁止外部盜鏈,圖片和文件外部盜鏈會(huì)給服務(wù)器帶來(lái)大量的負(fù)載壓力,可以通過(guò)refer來(lái)禁止外部盜鏈,或者使用apache來(lái)配置禁止盜鏈??刂拼笪募南螺d,大文件的下載對(duì)于非SCSI硬盤來(lái)說(shuō)會(huì)占用大量的資源,導(dǎo)致服務(wù)器的響應(yīng)能力下降。使用不同的主機(jī)分流主要流量,使服務(wù)器均衡負(fù)載。使用流量統(tǒng)計(jì)軟件統(tǒng)計(jì)分析網(wǎng)站流量,可以知道哪些地方耗費(fèi)了大量的流量,哪些頁(yè)面需要再進(jìn)行優(yōu)化。延伸閱讀1:大型網(wǎng)站系統(tǒng)的特點(diǎn)
高并發(fā),大流量,需要面對(duì)高并發(fā)用戶,大流量訪問(wèn),Google日均PV數(shù)為35億,日均IP訪問(wèn)數(shù)為3億,2011年騰訊QQ最大用戶在線數(shù)1.4億,淘寶2012年雙11活動(dòng)一天交易額191億,活動(dòng)開(kāi)始名列前茅分鐘獨(dú)立訪問(wèn)用戶達(dá)1000萬(wàn)。