摘要:
我是這樣理解Java的:“線程中介之Java線程池”
在云計算、5G技術(shù)快速發(fā)展的互聯(lián)網(wǎng)世界,為了快速響應(yīng)用戶的請求,宏觀上除了團隊內(nèi)部實行DevOps機制管理、使用微服務(wù)架構(gòu)進行技術(shù)設(shè)計、使用Docker或K8s進行應(yīng)用部署外,微觀上在程序開發(fā)中使用并行計算的能力也是必不可少的。
而在Java開發(fā)中,最常用的便是通過線程池來最大程度利用CPU資源,實現(xiàn)多任務(wù)并行。
我們先來看一個用戶請求快速響應(yīng)的案例:北京在五一假期前的突然將應(yīng)急響應(yīng)程度從一級降為二級,從低風(fēng)險地區(qū)入京不需要隔離,這消息一經(jīng)放出,仿佛沉寂的北京和人們又活過來了。
大家紛紛開始在各平臺購買機票、火車票,試想當(dāng)你在去哪兒網(wǎng)查詢從北京到日本的機票時,半天都刷不出來,又或是先有航班的班次、再有價格、繼而有座位出來、最后出來整個圖片(串行執(zhí)行),蝸牛般的速度讓你瞬間就離開該平臺了。
為了快速的響應(yīng)用戶請求,在程序開發(fā)中一般采用多線程并發(fā)執(zhí)行,即當(dāng)用戶發(fā)起查詢航班請求時,將獲取航班班次、價格信息、座位信息、圖片信息這四個任務(wù)一起執(zhí)行(并行執(zhí)行),再返回給用戶,將原來的時間縮減3/4。
在本案例中通過多線程并發(fā)執(zhí)行的方式快速的響應(yīng)了用戶請求,接下來我們介紹線程池~
在介紹線程池原理之前,首先得了解什么是線程池。線程池,望文生義,就是線程的池子,里面有很多很多的線程。
我們知道一個程序運行時是一個進程,而程序里有很多的方法要去執(zhí)行,每個方法就是一個線程,在剛剛的案例中去哪兒平臺程序就是一個進程,里面獲取航班班次的函數(shù)、獲取航班價格的函數(shù)、獲取航班位置的函數(shù)就是多個線程。
每個函數(shù)在運行時,都需要先把線程創(chuàng)建起來,然后運行,最后函數(shù)執(zhí)行完畢銷毀線程。如果每個函數(shù)運行時都去創(chuàng)建線程、運行完畢都去銷毀線程,這實現(xiàn)太耗費線程資源,如果有一個地方專門負責(zé)線程的創(chuàng)建和銷毀,程序的函數(shù)要運行時直接去申請,那么資源的消耗是不是就降低了很多(不需要創(chuàng)建和銷毀)、函數(shù)的響應(yīng)速度是不是就提高了很多呢?(每次來就使用了,不需要去創(chuàng)建)、線程的管理是不是就更專業(yè)了呢?(有專門的地方管理線程),是的,這個地方就是線程池,通過池化的思想統(tǒng)一管理分配線程。
接下來我們介紹在Java中線程池是如何實現(xiàn)的。Java中的線程池核心實現(xiàn)包括四個模塊Executor、ExecutorService、AbstractExecutorService、ThreadPoolExecutor。
Executor是線程池對外的接口,研發(fā)人員只需將需要運行的函數(shù)(即任務(wù))傳遞給Executor即可,Executor就會完成線程的調(diào)配和任務(wù)的執(zhí)行部分。
ExecutorService是對Executor能力的擴展,研發(fā)人員是將任務(wù)一個個的傳遞給Executor,但是ExecutorService可將多個任務(wù)提煉成一個總?cè)蝿?wù),并且可管控線程池。
AbstractExecutorService是對上層的抽象,將執(zhí)行任務(wù)的流程串聯(lián)起來,使得最底層ThreadPoolExecutor只關(guān)注于任務(wù)的實現(xiàn)即可。ThreadPoolExecutor則是最復(fù)雜的底層,一方面要維護自身生命周期,一方面管理線程和任務(wù)。
那么ThreadPoolExecutor是如何管理線程和任務(wù)呢?
其中在它內(nèi)部也維護著一個生產(chǎn)者消費者模型,在介紹消息中間件MQ的時候我們也詳細地介紹過生產(chǎn)者消費者,它的優(yōu)點之一是實現(xiàn)了解耦,即生產(chǎn)者往隊列里發(fā)送任務(wù),不必等待該任務(wù)執(zhí)行完再發(fā)送下一個生產(chǎn)者,消費者只管從隊列里獲取任務(wù)進行線程分配,不必等到生產(chǎn)者發(fā)送任務(wù)。
在ThreadPoolExecutor中任務(wù)管理便是生產(chǎn)者,線程管理便是消費者,當(dāng)任務(wù)提交后,線程池判斷該任務(wù)得如何執(zhí)行。
在線程池內(nèi)部有五種狀態(tài),Running則表示該線程能接受新提交的任務(wù)并且也能處理阻塞隊列中的任務(wù)。Shutdown則表示不能接受新提交的任務(wù)但可以繼續(xù)處理阻塞隊列中已保存的任務(wù)。Stop則表示不能接受新任務(wù),也不能處理隊列中的任務(wù),會中斷正在處理任務(wù)的線程。Tidying則表示所有的任務(wù)都終止了,有效線程數(shù)為0;Terminated則表示終結(jié)狀態(tài)。其生命周期的轉(zhuǎn)化如圖所示。
當(dāng)任務(wù)進來時,線程池首先會檢查自己的狀態(tài),如果不是Running狀態(tài),那么直接拒絕任務(wù)的執(zhí)行;如果線程是Running狀態(tài),而且線程數(shù)量<線程池正常大小數(shù)(即沒有任務(wù)需要執(zhí)行時線程池的大小,簡稱核心數(shù)corePoolSize),那么創(chuàng)建并啟動一個線程來執(zhí)行新提交的任務(wù);如果線程數(shù)量>;核心數(shù),并且線程池內(nèi)的阻塞隊列沒有滿,那么將該任務(wù)加入到阻塞隊列等待執(zhí)行;如果線程數(shù)量>;核心數(shù)并且<線程池最大數(shù),并且線程池內(nèi)的阻塞隊列沒有滿,那么創(chuàng)建一個新的線程來執(zhí)行提交的任務(wù),如果線程數(shù)量>線程池最大線程數(shù),并且線程池內(nèi)的阻塞隊列已滿,那么拒絕處理該任務(wù)。
因此在線程池管理中,最大線程數(shù)、線程池正常大小數(shù)非常重要,如果過少可能導(dǎo)致線程不夠用,任務(wù)不能執(zhí)行,如果過多可能導(dǎo)致任務(wù)在緩存隊列里等待時間長,最終超時不能執(zhí)行。對于該數(shù)量的設(shè)置,目前也沒有官方的算法,更多是通過監(jiān)控數(shù)據(jù)和業(yè)務(wù)運行特征來不斷地調(diào)整。
通過線程池統(tǒng)一管理線程能提高資源的使用率、提高用戶響應(yīng)時間。事實上,在程序世界里,除了運行函數(shù)的線程使用了池化管理的方式之外,當(dāng)程序連接數(shù)據(jù)庫時,也通過數(shù)據(jù)庫連接池的方式統(tǒng)一管理數(shù)據(jù)庫連接資源,當(dāng)程序運行需要內(nèi)存時,也通過內(nèi)存池的方式統(tǒng)一管理內(nèi)存資源。
這種統(tǒng)一化管理資源的方式,使得用戶在低投入中獲取了最高效率的資源利用,實現(xiàn)了共贏。
這就和鏈接、我愛我家、自如這樣的大型房地產(chǎn)公司統(tǒng)一管理出租房源是一樣的道理。以前租客要租房屋時,需要找到多個房東,咨詢詳細地理位置、價格、房屋圖片,貨比三家后再進行簽約。而房屋中介將房屋收置后,租客要租房屋只需要提交自己的租房要求(地理位置&價格),中介就會對應(yīng)的提供很多選擇,并且推薦最合適的給你。通過統(tǒng)一化管理的方式提高了租客的租房效率,實現(xiàn)了共贏。
在互聯(lián)網(wǎng)快速發(fā)展的今天,任何一家企業(yè)想要長久的站穩(wěn)市場,除了提供的產(chǎn)品能滿足用戶不斷變化的需求之外,產(chǎn)品的好用性能也是非常重要的,通過多線程開發(fā)的模式能很好的提高程序性能,本文只是拋磚引玉介紹了Java線程池的使用場景、實現(xiàn)原理、解決問題,但如何讓其服務(wù)于良好的產(chǎn)品性能,就需要大家在實踐中不斷地摸索總結(jié)了