【初心者向け】PythonでPyTorch入門｜ディープラーニングの基礎をやさしく解説

ディープラーニングを学ぶ上で欠かせないライブラリの一つが「PyTorch」です。Pythonで使えるこのフレームワークは直感的でコードが書きやすく、研究から実務まで幅広く利用されています。この記事では、PyTorchを初めて学ぶ方に向けて、基礎から実践までわかりやすく解説します。

PyTorchとは？
PyTorchを始める準備
1. インストール方法
2. 基本のインポート
PyTorchでできること
実際に使ってみよう：基本的なニューラルネットワーク
モデルの評価と改善
1. 評価方法
2. 過学習を防ぐ工夫
応用テクニック
1. 転移学習
2. GPUを使った高速化
よくあるエラーと注意点
プログラミング初心者におすすめのサービス
まとめ

PyTorchとは？

PyTorch（パイトーチ）は、Facebook（現Meta）が開発したオープンソースのディープラーニングライブラリです。計算グラフを動的に構築できるため、柔軟性が高く研究者に人気があります。さらに、直感的なコードでニューラルネットワークを実装できるので、初心者にも学びやすいのが特徴です。現在ではTensorFlowと並び、世界中のAI研究や実務で使われています。

PyTorchを始める準備

インストール方法

PyTorchは公式サイトから環境に応じたコマンドをコピーしてインストールできます。まずはCPU版で試すのが安心です。以下はpipを使った基本のインストール例です。

pip install torch torchvision torchaudio

もしGPU環境を利用する場合は、CUDA対応版をインストールする必要があります。その際は公式ページを確認しましょう。

基本のインポート

PyTorchを利用する際は、以下のようにtorchをインポートします。ニューラルネットワーク関連はtorch.nn、データ操作はtorch.utils.dataを使うのが一般的です。

import torch
import torch.nn as nn
import torch.optim as optim

PyTorchでできること

画像認識

PyTorchはCNN（畳み込みニューラルネットワーク）の実装に優れており、画像分類や物体検出に幅広く利用されています。学習済みモデルを使えば短時間で高精度な画像認識システムを構築可能です。

自然言語処理

RNNやTransformerを用いた文章生成や感情分析もPyTorchで実装できます。特にHugging Face Transformersと組み合わせると、BERTやGPTなどの強力なモデルを簡単に利用できます。

時系列データ解析

株価予測やセンサーデータ解析など、時系列データの扱いにも適しています。LSTMやGRUといった再帰型ネットワークを使うことで、複雑なパターンを学習できます。

実際に使ってみよう：基本的なニューラルネットワーク

ここではMNIST手書き数字データセットを用いた分類タスクの例を紹介します。

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms

# データ準備
transform = transforms.ToTensor()
train_dataset = datasets.MNIST(root="./data", train=True, download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True)

# モデル定義
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(28*28, 128)
        self.fc2 = nn.Linear(128, 10)
    def forward(self, x):
        x = x.view(-1, 28*28)
        x = torch.relu(self.fc1(x))
        x = self.fc2(x)
        return x

model = Net()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 学習ループ
for epoch in range(5):
    for images, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

このシンプルなネットワークでも、手書き数字の分類精度を短時間で高められます。

モデルの評価と改善

評価方法

学習後はテストデータを用いて正解率を確認します。もし精度が思ったほど出ない場合は、層を増やす、学習率を調整するなどの工夫が必要です。

過学習を防ぐ工夫

PyTorchではDropoutを追加することで過学習を軽減できます。また、学習データを水増しする「データ拡張」も効果的です。

self.dropout = nn.Dropout(0.5)
x = self.dropout(torch.relu(self.fc1(x)))

応用テクニック

転移学習

大規模データで学習済みのモデルを利用すれば、少ないデータでも高精度を実現できます。torchvision.modelsにはResNetやVGGといったモデルが含まれており、簡単に利用可能です。

GPUを使った高速化

モデルやデータをGPUに移すだけで計算が大幅に高速化されます。

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

よくあるエラーと注意点

初心者がつまずきやすいのは「テンソルの形状エラー」です。例えば入力データをviewで整形していない場合、モデルに通せずエラーになります。また、GPUを利用する際にはmodelやデータを同じデバイスに移す必要があります。さらに、バージョンによる書き方の違いもあるため、公式ドキュメントを常に確認しましょう。

▶ PyTorch公式チュートリアルはこちら