TransferTraj/pipeline.py at master · wtl52656/TransferTraj · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
from time import time

import pandas as pd
import numpy as np
import torch
from tqdm import trange, tqdm
from torch.optim.lr_scheduler import StepLR

def train_model(model, dataloader, device, num_epoch, lr):
    """Train the model given the training dataloader.

    Args:
        model (nn.Module): the model to train.
        dataloader (DataLoader): batch iterator containing the training data.
        num_epoch (int): number of epoches to train.
        lr (float): learning rate for the optimizer.
    """
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)
    model.train()

    bar_desc = 'Training, avg loss: %.5f'
    log = []
    saved_model_state_dict = None
    best_loss = 1e9
    with trange(num_epoch, desc=bar_desc % 0.0) as bar:
        for epoch_i in bar:
            loss_values = []
            epoch_time = 0

            for batch in tqdm(dataloader, desc='-->Traversing', leave=False):
                (input_tensor, output_tensor, pos_tensor, first_point) = batch
                # print(input_tensor.shape, output_tensor.shape, pos_tensor.shape, first_point.shape)
                # exit()
                input_tensor, output_tensor, pos_tensor, first_point = input_tensor.to(device), output_tensor.to(device), pos_tensor.to(device), first_point.to(device)
                optimizer.zero_grad()
                s_time = time()
                loss = model.loss(input_tensor, output_tensor, pos_tensor, first_point)
                loss.backward()
                optimizer.step()
                e_time = time()
                loss_values.append(loss.item())
                epoch_time += e_time - s_time
            loss_epoch = np.mean(loss_values)
            bar.set_description(bar_desc % loss_epoch)
            log.append([epoch_i, epoch_time, loss_epoch])

            if loss_epoch < best_loss:
                best_loss = loss_epoch
                saved_model_state_dict = model.state_dict()


    log = pd.DataFrame(log, columns=['epoch', 'time', 'loss'])
    log = log.set_index('epoch')
    return log, saved_model_state_dict

def finetune_model(model, dataloader, device, num_epoch, lr):
    """Train the model given the training dataloader.

    Args:
        model (nn.Module): the model to train.
        dataloader (DataLoader): batch iterator containing the training data.
        num_epoch (int): number of epoches to train.
        lr (float): learning rate for the optimizer.
    """
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)
    scheduler = StepLR(optimizer,
                step_size = 5, # Period of learning rate decay
                gamma = 0.5)
    model.train()

    bar_desc = 'Training, avg loss: %.5f'
    log = []
    saved_model_state_dict = None
    best_loss = 1e9
    with trange(num_epoch, desc=bar_desc % 0.0) as bar:
        for epoch_i in bar:
            loss_values = []
            epoch_time = 0

            for batch in tqdm(dataloader, desc='-->Traversing', leave=False):
                (input_tensor, output_tensor, pos_tensor, first_point) = batch
                # for i in [input_tensor, output_tensor, pos_tensor, first_point]:
                #     print(i.shape)
                # exit()
                input_tensor, output_tensor, pos_tensor, first_point = input_tensor.to(device), output_tensor.to(device), pos_tensor.to(device), first_point.to(device)
                optimizer.zero_grad()
                s_time = time()
                loss = model.loss(input_tensor, output_tensor, pos_tensor, first_point)
                loss.backward()
                optimizer.step()
                e_time = time()
                loss_values.append(loss.item())
                epoch_time += e_time - s_time
            loss_epoch = np.mean(loss_values)
            bar.set_description(bar_desc % loss_epoch)
            log.append([epoch_i, epoch_time, loss_epoch])

            if loss_epoch < best_loss:
                best_loss = loss_epoch
                saved_model_state_dict = model.state_dict()

            scheduler.step()

    log = pd.DataFrame(log, columns=['epoch', 'time', 'loss'])
    log = log.set_index('epoch')
    return log, saved_model_state_dict


@torch.no_grad()
def test_model(model, device, dataloader):
    """Test the model given the testing dataloader.

    Args:
        model (nn.Module): the model to test.
        dataloader (dataloader): batch iterator containing the testing data.
    """
    model.eval()

    predictions, targets = [], []
    for batch in tqdm(dataloader, desc='Testing'):
        (input_tensor, output_tensor, pos_tensor, first_point) = batch
        input_tensor, output_tensor, pos_tensor, first_point = input_tensor.to(device), output_tensor.to(device), pos_tensor.to(device), first_point.to(device)

        pred, target = model.test(input_tensor, output_tensor, pos_tensor, first_point)
        predictions.append([p for p in pred])
        targets.append([t for t in target])

    predictions = [pad_batch_arrays(item) for item in zip(*predictions)]
    targets = [pad_batch_arrays(item) for item in zip(*targets)]

    return predictions, targets


def pad_batch_arrays(arrs):
    """Pad a batch of arrays with representing feature sequences of different lengths.

    Args:
        arrs (list): each item is an array with shape (B, L, ...). The length L is different for different arrays.

    Returns:
        np.array: padded arrays with shape (B_agg, L_max, ...) that are concatenated along the batch axis.
    """
    max_len = max(a.shape[1] for a in arrs)
    arrs = [
        np.concatenate([a, np.repeat(a[:, -1:], repeats=max_len-a.shape[1], axis=1)], axis=1)
        for a in arrs
    ]
    return np.concatenate(arrs, 0)