Page 1 of 1

使用英特爾® VTune™ Profiler 提升 AI/ML 應用程式的效能

Posted: Wed Dec 04, 2024 8:17 am
by aminakhatun26
了解 oneAPI 支援的工具如何協助分析資料並行 Python* 和 OpenVINO™ 工作負載


人工智慧和機器學習 (ML) 領域不斷擴大其在醫療保健和生命科學、行銷和金融、製造、機器人、自動駕駛汽車、智慧城市和其他幾個工業領域的應用領域。 PyTorch*、TensorFlow*、Keras* 等深度學習框架構成了這些現實世界領域中使用的機器學習 (ML) 工作負載的支柱。

OpenVINO™ 工具包等其他開發人員資源也透過「一次編寫,隨處部署」策略,有助於在電腦視覺和生成人工智慧 (GenAI)等領域的最新硬體架構上加速人工智慧開發。自 2018 年推 香港流動電話號碼表 出以來,開源 OpenVINO 工具套件一直致力於以更低的延遲和更高的吞吐量加速 AI 推理,同時保持準確性、減少模型佔用空間並優化硬體使用。

深度學習模型涉及非線性函數和多層的複雜結構使得識別和分析底層原始程式碼中的效能瓶頸變得困難。 PyTorch 和 TensorFlow 等機器學習框架提供了分析 API 和本機工具,用於在模型開發的不同階段測量和分析效能指標。然而,這些方法的範圍僅限於軟體功能。由oneAPI驅動的英特爾® VTune™ Profiler透過深入了解硬體層級的運算和記憶體瓶頸來解決這項挑戰。這有助於解決效能問題,並在具有不同運算範圍的硬體平台上優化和擴展人工智慧應用程式的效能。

在本部落格中,您將了解英特爾 VTune Profiler 如何協助分析平行 Python 和 OpenVINO 應用程式的數據,從而擴大 AI/ML 工作負載的最佳化範圍。



使用英特爾® VTune™ Profiler 增強 Python* 應用程式的效能

Image


Intel VTune Profiler Cookbook 中新發布的秘技說明了 VTune Profiler 如何協助分析 Python 應用程式。讓我們更深入地研究使用手冊中討論的 NumPy* 庫進行成對距離計算的範例。

該配方的基本軟體要求包括:

適用於 Python* 的英特爾® 發行版
Python 的資料並行擴展
VTune Profiler (2022 年版或更高版本)
英特爾® oneAPI DPC++/C++ 編譯器
注意:詳細的硬體和軟體需求,請查閱配方配置詳細資訊。

本秘籍中討論的 NumPy 實作使用英特爾® oneAPI 數學核心庫 (oneMKL)例程進行距離計算,並使用英特爾® 儀器和追蹤技術 (ITT) API將計算劃分為邏輯任務。然後,VTune Profiler 工具可以幫助分析每個邏輯任務的執行時間和記憶體消耗,使您能夠決定需要重點修改程式碼的哪些部分,以實現額外的效能。

當在NumPy 實作上執行熱點分析時,輸出分析報告會提供有關最消耗 CPU 時間的程式碼部分的詳細資訊。它還提供了探索分析器工具的其他效能分析功能的建議,例如用於提高並行性的執行緒分析和用於有效使用底層硬體的微架構探索分析。