Video_Classification_PyTorch/clip_test.py at vid_cls · NNU-GISA/Video_Classification_PyTorch

101 lines (85 loc) · 3.07 KB
import argparse
import time
import shutil
import logging
import torch
import torchvision
import torch.nn.parallel
import torch.backends.cudnn as cudnn
import torch.optim
from lib.dataset import VideoDataSet
from lib.models import VideoModule
from lib.transforms import *
from lib.utils.tools import *
from lib.opts import args
from train_val import train, validate
def main():
    global args, best_metric
    # specify dataset
    if args.dataset == 'ucf101':
        num_class = 101
    elif args.dataset == 'hmdb51':
        num_class = 51
    elif args.dataset == 'kinetics400':
        num_class = 400
    elif args.dataset == 'kinetics200':
        num_class = 200
        raise ValueError('Unknown dataset '+args.dataset)
    data_root = os.path.join(os.path.dirname(os.path.abspath(__file__)), 
                             "data/{}/access".format(args.dataset))
    # create model
    org_model = VideoModule(num_class=num_class, 
        base_model_name=args.arch,
        dropout=args.dropout,
        pretrained=args.pretrained,
        pretrained_model=args.pretrained_model)
    num_params = 0
    for param in org_model.parameters():
        num_params += param.reshape((-1, 1)).shape[0]
    print("Model Size is {:.3f}M".format(num_params/1000000))
    model = torch.nn.DataParallel(org_model).cuda()
    criterion = torch.nn.CrossEntropyLoss().cuda()
    optimizer = torch.optim.SGD(model.parameters(),
                                momentum=args.momentum,
                                weight_decay=args.weight_decay)
    # optionally resume from a checkpoint
    if args.resume:
        if os.path.isfile(args.resume):
            print(("=> loading checkpoint '{}'".format(args.resume)))
            checkpoint = torch.load(args.resume)
            args.start_epoch = checkpoint['epoch']
            best_metric = checkpoint['best_metric']
            model.load_state_dict(checkpoint['state_dict'])
            optimizer.load_state_dict(checkpoint['optimizer'])
            print(("=> loaded checkpoint '{}' (epoch {})"
                  .format(args.resume, checkpoint['epoch'])))
        else:
            print(("=> no checkpoint found at '{}'".format(args.resume)))
    ## val data
    val_transform = torchvision.transforms.Compose([
        GroupScale(args.new_size),
        GroupCenterCrop(args.crop_size),
        Stack(mode=args.mode),
        ToTorchFormatTensor(),
        GroupNormalize(),
    val_dataset = VideoDataSet(root_path=data_root, 
        list_file=args.val_list,
        t_length=args.t_length,
        t_stride=args.t_stride,
        num_segments=args.num_segments,
        image_tmpl=args.image_tmpl,
        transform=val_transform,
        phase="Val")
    val_loader = torch.utils.data.DataLoader(
        val_dataset,
        batch_size=args.batch_size, shuffle=False, 
        num_workers=args.workers, pin_memory=True)
    if args.mode != "3D":
        cudnn.benchmark = True
    validate(val_loader, model, criterion, args.print_freq, args.start_epoch)
if __name__ == '__main__':
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

clip_test.py

Latest commit

History

clip_test.py

File metadata and controls