CATEGORY

Python

PyTorchの量子化とQuantization aware trainingについて

量子化とQuantization aware training ベータ版ですがPyTorchでの量子化とQuantization aware trainingについて記述された記事が公開されています。今回はこの内容を試してみたいと思います。注意点としてCPUでのみしか実行できないようです。(2020年9月24日時点) https://pytorch.org/tutorials/advanced/s […]

GPU dashboardでGPUクロックを確認できるようにする

環境構築と動作方法 環境構築や動作確認方法は下記の記事を参考にしてください。 GPUクロックの確認のための修正 Rapidsのdockerコンテナに入り、下記のコードを編集します。GPUクロックの項目を追加します。 /opt/conda/envs/rapids/lib/python3.6/site-packages/jupyterlab_nvdashboard/server.py 下記のコードを編 […]

Triton Inference Serverを使って簡単に画像分類を行う

Triton Inference Server 今回はTriton Inference Serverを使ってみます。推論用のサーバーを立ててHTTP/RESTもしくはGRPC経由で動作可能です。クライアント側から推論処理をしたいデータをサーバーに送って処理を行います。 下記のような特徴があります。 複数のフレームワークをサポート:ONNXやSavedModelなど 複数のモデルの同一GPUでの同時 […]

グラフデータの探索処理をcuGraphで高速化できるか検証した

環境情報 GPUでグラフデータを高速に解析できるcuGraphを発見しました。 https://github.com/rapidsai/cugraph NGCからdockerコンテナを取得して動作確認をしました。NGCの設定方法は下記をご覧ください。 構築環境は下記です。 ハードウェア CPU: Intel(R) Core(TM) i9-9900K CPU @ 3.60GHz Memory: 64 […]

SparkがGPU対応したようなので試してみた

*注意書き:クラスター環境ではなくGPUが動作するか確かめただけなので注意してください。 動作環境 OS: Ubuntu CPU(1枚): Intel(R) Core(TM) i9-9900K CPU @ 3.60GHz GPU(1枚): Geforce 2080 Ti Memory: 64GB 下記の記事に簡単な試す手法が記述されていたので環境構築して試してみます。 https://nvidia […]

cumlを用いてGPUでxgboostの学習を高速化できるか試す

Xgboostによる推論高速化 前回のブログではxgboostの推論がcumlで高速化できるかを試してみました。 推論速は約7倍ほど早くなりました。 今回は下記のコードを参考にしました。 https://github.com/rapidsai/xgboost-conda/blob/branch-0.13/notebooks/XGBoost_Demo.ipynb 環境構築、動作環境は前回の記事を参考 […]

cumlを用いてGPUでxgboostの推論が高速化するか試す

XGboostについて Deep LearningはGPUを高速化するので有名ですが、機械学習の分野で有名なxgboostも高速化します。詳細は下記をご覧ください。 https://rapids.ai/xgboost.html XGboostは勾配ブーストを用いた決定木によるクラス分類や下記を行うモデルです。 数式をなるべく除いてイメージだけ説明してみます。下記のようなデータ・セットを用意します。 […]

PyProfでPyTorchのGPU上での動作をプロファイルする

DLProfのDeepLearningのプロファイリング 前回のブログではDLProfでプロファイリングしてTensorboardで確認しました。 Pyprofのプロファイリング 今回は別の方法でプロファイルする方法を確認してみます。pyprofだとDLProfと異なり、レイヤーごとの時間が分かるので動作がクリティカルに重いレイヤーを把握するのに役立ちます。 https://github.com/ […]

DLProfでDeep LearningのGPUでの動作内容を把握してみた

DLProfについて Deep LearningのGPU上での動作を確認できるツールが出たようなのでどのような情報が確認できるか確かめてみました。 参考にしたのは下記の2つの記事です。本ブログではよくPyTorchを使用しているためPyTorchで動作確認しました。 https://docs.nvidia.com/deeplearning/frameworks/tensorboard-plugin […]

音声データの特徴抽出(メル尺度、MFCC)処理をDALIで高速化できるか試した。

前回の記事でスペクトラム変換は高速に処理できることが確認できました。音声処理ではスペクトラム変換以外にメル尺度に基づいたスペクトラム変換やMFCC変換処理もよく使用されます。これらの処理も高速に処理できるか試してみます。 メル尺度 音高の知覚尺度です。下記の図を見れば分かりますが約5000[Hz]以下では急激に増加し、そこからなだらかになっています。つまり周波数の増加量と人間が知覚する音の高さは比 […]

Close Bitnami banner
Bitnami