• <tbody id="844xo"><nobr id="844xo"></nobr></tbody>

      <bdo id="844xo"></bdo>
      <div id="844xo"><optgroup id="844xo"></optgroup></div><div id="844xo"></div>
      <nobr id="844xo"><optgroup id="844xo"></optgroup></nobr>

      <nobr id="844xo"><dfn id="844xo"></dfn></nobr><progress id="844xo"><div id="844xo"><optgroup id="844xo"></optgroup></div></progress>

      新聞中心

      EEPW首頁 > 設計應用 > 基于硬件跟蹤的Linux系統性能優化

      基于硬件跟蹤的Linux系統性能優化

      作者:劉棟時間:2019-02-26來源:電子產品世界收藏

        作者/劉棟(勞特巴赫(蘇州)技術有限公司,江蘇 蘇州 215021)

      本文引用地址:http://www.dxpaa.com/article/201902/397962.htm

        摘要:隨著系統的復雜度越來越高,如何并優化系統性能,以提高系統硬件的使用效率,減輕系統負載也越來越重要。其關系到整個產品的成本和使用體驗,甚至影響產品上市期限。

        雖然在中,有很多開源軟件可以用來測量整個系統的性能,但是這些軟件同時可能也會引進其他問題,最終導致優化過程變得更加復雜。本文將介紹德國的ADIT公司面臨的類似問題,并最終如何使用勞特巴赫的TRACE32這一非侵入式工具來解決這些問題。

        關鍵詞;;

        1 Linux軟件調試的挑戰

        德國ADIT(Advanced Driver Information Technology GmbH)的最初方案是在Arm和Intel平臺上均部署Linux,使用SystemTap來測量整體系統性能以定位并消除性能瓶頸。SystemTap使用了Linux的一些很好的功能:uprobe和kprobe。這些功能允許用戶創建一個動態的跟蹤過程,可以分別跟蹤用戶級別和內核級別的函數。

        借助工具來減輕系統負載這個理念本身并沒有問題,而且ADIT一開始也期望諸如SystemTap等軟件工具僅對整體系統的實時性能產生較小的影響。然而出乎意料的是,使用了這些軟件后,Arm平臺相較于Intel平臺而言,其系統速度的下降幅度明顯大于后者。為了確認問題所在,ADIT創建了一個空函數,并且通過uprobe來進行測量。結果表明,在Arm平臺上,調用一次uprobe耗費的時間是Intel平臺的兩倍。因為uprobe內部使用了kprobe,所以最初的懷疑是kprobe導致了前述問題。然而這種懷疑是錯誤的,因為實際上kprobe在Arm處理器上比在Intel處理器上運行得更快,所以很顯然問題出在uprobe代碼中。既然問題出在軟件跟蹤工具的代碼中,那么軟件跟蹤工具就不適合用來解決定位問題。

        “因為內核uprobe代碼并不簡單,一時間我不知道該如何繼續。于是我決定使用TRACE32來對之前的問題一探究竟。有些時候,圖像是很有幫助的。基于圖表,我可以選擇部分區域的代碼來做更深層次的分析。”ADIT的開發者Frederic Berat說道。

        2 TRACE32 PowerTrace效果

        因此,ADIT決定使用TRACE32 PowerTrace的硬件跟蹤功能,該跟蹤功能不會對目標系統的時序有任何影響,同時也允許使用者對最小代碼部分進行深入分析。

        Arm和Intel設備都能提供非侵入式的程序流信息,Arm的這種技術是ETM(嵌入式跟蹤宏單元),Intel相應的技術則是IPT(Intel處理器跟蹤)。代碼的執行信息會通過一系列專用的引腳傳輸出來。TRACE32工具連上這些引腳后,無需修改客戶任何程序代碼,就能夠實時收集數據并分析,以此產生應用程序的函數流和每個函數的詳細時序。

        ADIT的工程師在他們當前的系統狀態下,直接連接TRACE32硬件后(如圖1),僅需在TRACE32軟件的TPIU配置窗口對PortSize和PortMode進行適當選擇(如圖2),即可獲取實時的跟蹤數據。整個系統的函數流都會被TRACE32軟件重建并以統計的方式進行展現,例如時序圖或函數層級圖。最終匯總成的這張圖表,還原出了一個完整的Linux系統的運行過程,不僅包含內核代碼也包含用戶代碼。根據這張圖表,ADIT的工程師們方便地定位到系統時間消耗的關鍵函數。同時他們也注意到開源性能測試軟件kprobe和uprobe給整個系統帶來的性能瓶頸。

        通過使用TRACE32的高級分析特性,ADIT的工程師們快速地定位出兩個明顯的問題點(見圖3和圖4)。最明顯的一個瓶頸,就是在Arm平臺,uprobe調用了preempt_disable()和preempt_enable()共四次,每一次都需要耗時0.6μs檢查棧幀。這樣一共導致了2.4μs的遲延。但這個現象在Intel平臺上并不會出現。雖然單次調用uprobe引起的2.4μs遲延似乎并不是很長,但因為每秒都調用了很多次,這部分延遲會迅速累積成嚴重的滯后。再進一步,第二個瓶頸是uprobe調用過程中的字符串操作。并且,受制于Arm和Intel之間的架構差異,這個瓶頸時間并不固定。

        如果沒有實時跟蹤功能,這些瓶頸就幾乎很難被發現。而有了實時跟蹤功能后,把這些信息跟蹤并記錄下就很簡單。明確了從何處著手調查,通過對跟蹤結果的分析,ADIT的工程師確認主要問題在于內核配置。在跨平臺遷移過程中,CONFIG_PREEMPT_TRACE這個配置項被無意地使用了。跟蹤結果顯示,這個配置被打開后,在Arm平臺會導致棧展開,但在Intel平臺并沒有影響,而正是這導致了兩個平臺之間明顯的性能差異。

        3 結論

        通過本文案例可以看出,在Linux系統性能分析和優化過程中,基于硬件的非侵入式實時跟蹤技術,不僅可以實現開源跟蹤軟件的所有功能,而且也可以對Boot相關的代碼進行跟蹤分析,同時還避免引進一些其他問題,并且統計結果更準確、數據分析形式更靈活。

      本文來源于科技期刊《電子產品世界》2019年第3期第27頁,歡迎您寫論文時引用,并注明出處



      評論

      技術專區

      關閉
      新疆11选5 500