一、select
select是較早出現(xiàn)的一種IO多路復(fù)用機(jī)制。在使用select時(shí),需要將所有需要監(jiān)視的文件描述符(通常是套接字)以位圖的形式傳入select函數(shù),select函數(shù)會(huì)阻塞等待,直到有IO事件發(fā)生。當(dāng)有IO事件發(fā)生時(shí),select函數(shù)會(huì)返回,并通過(guò)檢查位圖中的相應(yīng)位來(lái)確定是哪些文件描述符發(fā)生了事件。然后可以通過(guò)遍歷位圖,逐一處理發(fā)生事件的文件描述符。
select的一個(gè)主要缺點(diǎn)是,每次調(diào)用select函數(shù)時(shí),都需要將全部的監(jiān)視文件描述符集合傳入,并在內(nèi)核中進(jìn)行線性掃描,這樣會(huì)帶來(lái)性能上的開(kāi)銷(xiāo)。另外,select函數(shù)返回后,需要遍歷位圖,逐一檢查發(fā)生事件的文件描述符,這也會(huì)帶來(lái)一定的時(shí)間開(kāi)銷(xiāo)。
二、poll
poll是在select的基礎(chǔ)上改進(jìn)而來(lái)的,它解決了select的一些問(wèn)題。與select不同的是,poll函數(shù)在調(diào)用時(shí)只需要傳入一個(gè)結(jié)構(gòu)數(shù)組,每個(gè)結(jié)構(gòu)中保存了一個(gè)文件描述符和該文件描述符的監(jiān)視事件。poll函數(shù)會(huì)阻塞等待,直到有IO事件發(fā)生。當(dāng)有IO事件發(fā)生時(shí),poll函數(shù)返回,并通過(guò)遍歷結(jié)構(gòu)數(shù)組來(lái)確定哪些文件描述符發(fā)生了事件。
相對(duì)于select,poll的改進(jìn)主要體現(xiàn)在兩個(gè)方面。首先,poll不需要每次都將全部的監(jiān)視文件描述符集合傳入,只需傳入一個(gè)結(jié)構(gòu)數(shù)組,這樣減少了傳參的開(kāi)銷(xiāo)。其次,poll函數(shù)返回后,直接通過(guò)遍歷結(jié)構(gòu)數(shù)組,可以快速確定發(fā)生事件的文件描述符,而不需要像select那樣進(jìn)行位圖的檢查。
然而,poll仍然存在一些問(wèn)題。首先,poll函數(shù)仍然需要在內(nèi)核中進(jìn)行線性掃描,當(dāng)監(jiān)視的文件描述符數(shù)量增多時(shí),性能會(huì)下降。其次,poll函數(shù)對(duì)于大量的文件描述符的處理仍然存在效率問(wèn)題。
三、epoll
epoll是Linux特有的一種IO多路復(fù)用機(jī)制,是select和poll的進(jìn)一步改進(jìn)。epoll使用一個(gè)事件驅(qū)動(dòng)的方式來(lái)實(shí)現(xiàn)IO多路復(fù)用,能夠高效地處理大量的文件描述符。
在使用epoll時(shí),需要通過(guò)epoll_create函數(shù)創(chuàng)建一個(gè)epoll實(shí)例。然后,使用epoll_ctl函數(shù)向epoll實(shí)例中添加文件描述符,并設(shè)置該文件描述符的監(jiān)視事件。epoll_wait函數(shù)會(huì)阻塞等待,直到有IO事件發(fā)生。當(dāng)有IO事件發(fā)生時(shí),epoll_wait函數(shù)返回一個(gè)事件列表,列表中包含了發(fā)生事件的文件描述符以及對(duì)應(yīng)的事件類(lèi)型。可以通過(guò)遍歷事件列表來(lái)處理發(fā)生事件的文件描述符。
相比于select和poll,epoll具有以下幾個(gè)優(yōu)點(diǎn):
支持較大的并發(fā)連接數(shù):epoll沒(méi)有固定的文件描述符數(shù)量限制,可以監(jiān)視成千上萬(wàn)的文件描述符,適用于高并發(fā)的場(chǎng)景。高效的事件通知機(jī)制:epoll只返回就緒的文件描述符,避免了遍歷整個(gè)集合的開(kāi)銷(xiāo),提高了性能。更好的內(nèi)存管理:epoll使用紅黑樹(shù)來(lái)存儲(chǔ)待監(jiān)聽(tīng)的文件描述符,使得添加和刪除操作的時(shí)間復(fù)雜度為O(log n),而不像select和poll需要遍歷整個(gè)集合。支持邊緣觸發(fā)和水平觸發(fā)模式:epoll可以設(shè)置為邊緣觸發(fā)模式(EPOLLET)或水平觸發(fā)模式(默認(rèn)模式)。邊緣觸發(fā)模式只在狀態(tài)變化時(shí)通知一次,需要用戶程序自行處理剩余的數(shù)據(jù)。而水平觸發(fā)模式會(huì)在文件描述符可讀、可寫(xiě)時(shí)一直通知,直到數(shù)據(jù)全部處理完。零拷貝技術(shù)支持:epoll可以與零拷貝技術(shù)結(jié)合使用,避免了數(shù)據(jù)在用戶態(tài)和內(nèi)核態(tài)之間的復(fù)制,提高了IO性能。支持EPOLLONESHOT事件:epoll可以設(shè)置EPOLLONESHOT事件,確保每個(gè)文件描述符在任意時(shí)刻只被一個(gè)線程處理,避免了多個(gè)線程同時(shí)處理同一個(gè)文件描述符的競(jìng)爭(zhēng)問(wèn)題。綜上所述,相比于select和poll,epoll在性能和擴(kuò)展性方面具有明顯優(yōu)勢(shì)。它通過(guò)事件驅(qū)動(dòng)和更高效的內(nèi)部數(shù)據(jù)結(jié)構(gòu),克服了select和poll的限制,并提供了更好的IO性能。在高并發(fā)的網(wǎng)絡(luò)編程場(chǎng)景下,使用epoll可以實(shí)現(xiàn)更高效的IO多路復(fù)用。然而,需要注意的是,epoll是Linux特有的機(jī)制,在跨平臺(tái)開(kāi)發(fā)時(shí)需要考慮兼容性。