阿里巴巴開源項目 Druid 負責人溫少訪談

時間 2020-12-31

Druid是阿里巴巴開源平臺上的一個項目，整個項目由數據庫連接池、插件框架和SQL解析器組成。該項目主要是爲了擴展JDBC的一些限制，可以讓程序員實現一些特殊的需求，比如向密鑰服務請求憑證、統計SQL信息、SQL性能收集、SQL注入檢查、SQL翻譯等，程序員可以通過定製來實現自己需要的功能。

該項目在阿里巴巴內部得到了廣泛的部署，在外部也有大量的用戶羣。爲了使大家更好地瞭解和使用Druid，我們採訪了Druid項目的主要負責人——溫少（博客）。

問：溫少是ITeye的名人了，爲了照顧新會員，先來個自我介紹吧！

溫少：我2001年畢業於深圳大學，畢業後到金蝶軟件研發中心工作9年，工作內容包括工作流引擎、多數據庫支持引擎、短信網網關等。

2010年3月加入阿里巴巴至今，主要的工作是設計和實現阿里巴巴應用監控系統Dragoon，Druid和Fastjson都是監控系統實現的副產品。

問：Druid是什麼？有什麼作用？

溫少：Druid首先是一個數據庫連接池，但它不僅僅是一個數據庫連接池，它還包含一個ProxyDriver，一系列內置的JDBC組件庫，一個SQL Parser。

問：Druid的項目背景？目前的項目團隊情況？開源目的？

溫少：2010年開始，我負責設計一個叫做Dragoon的監控系統，需要一些監控組件，監控應用程序的運行情況，包括Web URI、Spring、JDBC等。爲了監控SQL執行情況，我做了一個Filter-Chain模式的ProxyDriver，缺省提供StatFilter。當時我還做了一個SQL Parser。老闆說，不如我們來一個更大的計劃，把連接池、SQL Parser、Proxy Driver合起來做一個項目，命名爲Druid，於是Druid就誕生了。

2011年2月春節期間，我完成了連接池（DruidDataSource）的第一個版本，4月開始在生產環境測試，2012年第一季度開始大規模實施。

提交過代碼的開發者有5個人，主要代碼是我維護，有一人專門負責內部實施。

通過開源，希望有更多使用場景，更多的反饋，更多人蔘與其中，共同打造最好的數據庫連接池。

問：Druid支持哪些數據庫？

溫少：Druid支持所有JDBC兼容的數據庫，包括Oracle、MySql、Derby、Postgresql、SQL Server、H2等等。

Druid針對Oracle和MySql做了特別優化，比如Oracle的PS Cache內存佔用優化，MySql的ping檢測優化。

問：Druid是如何擴展JDBC的?

溫少：Druid在DruidDataSourc和ProxyDriver上提供了Filter-Chain模式的擴展API，類似Serlvet的Filter，配置Filter攔截JDBC的方法調用。

問：爲什麼說Druid是「最好的數據庫連接池」?體現在哪些方面？這是如何實現的？

溫少：阿里巴巴是一個重度使用關係數據庫的公司，我們在生產環境中大量的使用Druid，通過長期在極高負載的生產環境中實際使用、修改和完善，讓Druid逐步發展成最好的數據庫連接池。Druid在監控、可擴展性、穩定性和性能方面都有明顯的優勢。

首先，強大的監控特性，通過Druid提供的監控功能，可以清楚知道連接池和SQL的工作情況。

監控SQL的執行時間、ResultSet持有時間、返回行數、更新行數、錯誤次數、錯誤堆棧信息。
SQL執行的耗時區間分佈。什麼是耗時區間分佈呢？比如說，某個SQL執行了1000次，其中0~1毫秒區間50次，1~10毫秒800次，10~100毫秒100次，100~1000毫秒30次，1~10秒15次，10秒以上5次。通過耗時區間分佈，能夠非常清楚知道SQL的執行耗時情況。
監控連接池的物理連接創建和銷燬次數、邏輯連接的申請和關閉次數、非空等待次數、PSCache命中率等

其次，方便擴展。Druid提供了Filter-Chain模式的擴展API，可以自己編寫Filter攔截JDBC中的任何方法，可以在上面做任何事情，比如說性能監控、SQL審計、用戶名密碼加密、日誌等等。

Druid內置提供了用於監控的StatFilter、日誌輸出的Log系列Filter、防禦SQL注入攻擊的WallFilter。
阿里巴巴內部實現了用於數據庫密碼加密的CirceFilter，以及和Web、Spring關聯監控的DragoonStatFilter。

第三，Druid集合了開源和商業數據庫連接池的優秀特性，並結合阿里巴巴大規模苛刻生產環境的使用經驗進行優化。

ExceptionSorter。當一個連接產生不可恢復的異常時，例如Oracle error_code_28 session has been killed，必須立刻從連接池中逐出，否則會產生大量錯誤。目前只有Druid和JBoss DataSource實現了ExceptionSorter。
PSCache內存佔用優化對於支持遊標的數據庫（Oracle、SQL Server、DB2等，不包括MySql），PSCache可以大幅度提升SQL執行性能。一個PreparedStatement對應服務器一個遊標，如果PreparedStatement被緩存起來重複執行，PreparedStatement沒有被關閉，服務器端的遊標就不會被關閉，性能提高非常顯著。在類似「SELECT * FROM T WHERE ID = ?」這樣的場景，性能可能是一個數量級的提升。但在Oracle JDBC Driver中，其他的數據庫連接池（DBCP、JBossDataSource）會佔用內存過多，極端情況可能大於1G。Druid調用OracleDriver提供管理PSCache內部API。
LRU是一個性能關鍵指標，特別Oracle，每個Connection對應數據庫端的一個進程，如果數據庫連接池遵從LRU，有助於數據庫服務器優化，這是重要的指標。Druid、DBCP、Proxool、JBoss是遵守LRU的。BoneCP、C3P0則不是。BoneCP在mock環境下性能可能還好，但在真實環境中則就不好了。

問：Druid的性能如何？能否給出一些測試對比數據？

溫少：性能不是Druid的設計目標，但是測試數據表明，Druid性能比DBCP、C3P0、Proxool、JBoss都好。

這裏有一些測試數據：http://code.alibabatech.com/wiki/pages/viewpage.action?pageId=2916539

問：談談Druid的SQL解析功能？效率如何？

溫少：Druid提供了MySql、Oracle、Postgresql、SQL-92的SQL的完整支持，這是一個手寫的高性能SQL Parser，支持Visitor模式，使得分析SQL的抽象語法樹很方便。

簡單SQL語句用時10微秒以內，複雜SQL用時30微秒。

通過Druid提供的SQL Parser可以在JDBC層攔截SQL做相應處理，比如說分庫分表、審計等。Druid防禦SQL注入攻擊的WallFilter就是通過Druid的SQL Parser分析語義實現的。

問：Druid的擴展性如何？

溫少：Druid提供Filter-Chain模式的插件框架，通過編寫Filter配置到DruidDataSource中就可以攔截JDBC的各種API，從而實現擴展。Druid提供了一系列內置Filter。

問：在SQL注入防禦方面，Druid的優勢是什麼？實現原理是什麼？

溫少：Druid的優勢是在JDBC最低層進行攔截做判斷，不會遺漏。

Druid實現了Oracle、MySql、Postgresql、SQL-92的Parser，基於SQL語法分析實現，理解其中的SQL語義，智能、準確、誤報率低。

具體細節參考這裏：http://code.alibabatech.com/wiki/display/Druid/WallFilter

問：目前Druid的應用（部署）情況？

溫少：Druid是阿里巴巴監控系統Dragoon的副產品，從Dragoon監控系統的數據來看，在阿里巴巴已經部署了600多個應用。在阿里巴巴外部也有很多Druid的用戶，外部用戶沒有正式統計數據，但經常有反饋。

問：我想將其中的某個模塊（比如監控模塊）用到其他連接池，是否可以？模塊的獨立性如何？

溫少：可以通過DruidDriver把內置的Filter用在其他連接池中。在2011年上半年DruidDataSource不成熟的時候，我們也是這麼做的。在其他連接池中使用內置的Filter，需要修改jdbc-url，使用DruidDriver作爲一個ProxyDriver。

問：我想在項目中使用，應該注意哪些事項？能否用於商業項目？

溫少：Druid是一個開源項目，基於Apache 2.0協議，你可以免費自由使用。Druid只支持JDK 6以上版本，不支持JDK 1.4和JDK 5.0。

問：配置是否複雜？能否給出一個典型的配置實例？

溫少：爲了方便大家遷移，Druid的配置和DBCP是基本一致的，如果你原來是使用DBCP，遷移是十分方便的，只需要把corg.apache.commons.dbcp.BasicDataSource修改爲om.alibaba.druid.pool.DruidDataSource就好了。

以下是一個參考配置：

    <bean id="dataSource" class="com.alibaba.druid.pool.DruidDataSource" init-method="init" destroy-method="close">           <property name="url" value="${jdbc_url}" />          <property name="username" value="${jdbc_user}" />          <property name="password" value="${jdbc_password}" />                     <property name="filters" value="stat" />                 <property name="maxActive" value="20" />          <property name="initialSize" value="1" />          <property name="maxWait" value="60000" />          <property name="minIdle" value="1" />                 <property name="timeBetweenEvictionRunsMillis" value="60000" />          <property name="minEvictableIdleTimeMillis" value="300000" />                 <property name="validationQuery" value="SELECT 'x'" />          <property name="testWhileIdle" value="true" />          <property name="testOnBorrow" value="false" />          <property name="testOnReturn" value="false" />                     <property name="poolPreparedStatements" value="true" />          <property name="maxPoolPreparedStatementPerConnectionSize" value="50" />      </bean>

在上面的配置中，通常你需要配置url、username、password，maxActive這三項。

在DruidDataSource中，你可以不配置DriverClass，它根據url自動識別。Druid能夠自動識別20多中url，常見的JDBC Driver都包括了。

問：我目前使用其他連接池（DBCP/C3P0/Proxool等），如何遷移到Druid？

溫少：從DBCP遷移最方便，把org.apache.commons.dbcp.BasicDataSource修改爲om.alibaba.druid.pool.DruidDataSource就好了。

Druid網站上提供了Druid/DBCP/C3P0/JBoss/WebLogic的參數對照表，通過這個對照表來遷移你目前的配置。

問：其他開發者如何反饋問題、提交bug？

溫少：Druid源碼託管在github.com上，項目地址是 https://github.com/AlibabaTech/druid。

你可以在github上提交patch和issue（包括bug和新特性）。你也可以加入我們的QQ羣92748305，和開發者以及其他用戶一起交流。

再分享一下我老師大神的人工智能教程吧。零基礎！通俗易懂！風趣幽默！還帶黃段子！希望你也加入到我們人工智能的隊伍中來！https://blog.csdn.net/jiangjunshow