Add additive and multiplicative augmentation

2020-05-07 15:35:49 -04:00 · 2020-05-07 15:35:49 -04:00 · 897c3563db
commit 897c3563db
parent 67e5ed9eb6
4 changed files with 72 additions and 19 deletions
--- a/map2map/args.py
+++ b/map2map/args.py
@ -73,7 +73,13 @@ def add_train_args(parser):
    parser.add_argument('--val-tgt-patterns', type=str_list,
            help='comma-sep. list of glob patterns for validation target data')
    parser.add_argument('--augment', action='store_true',
-            help='enable training data augmentation')
+            help='enable data augmentation of axis flipping and permutation')
    parser.add_argument('--aug-add', type=float,
            help='additive data augmentation, (normal) std, '
            'same factor for all fields')
    parser.add_argument('--aug-mul', type=float,
            help='multiplicative data augmentation, (log-normal) std, '
            'same factor for all fields')
    parser.add_argument('--adv-model', type=str,
            help='enable adversary model from .models')
--- a/map2map/data/fields.py
+++ b/map2map/data/fields.py
@ -18,7 +18,10 @@ class FieldDataset(Dataset):
    `in_norms` is a list of of functions to normalize the input fields.
    Likewise for `tgt_norms`.
-    Data augmentations are supported for scalar and vector fields.
+    Scalar and vector fields can be augmented by flipping and permutating the axes.
    In 3D these form the full octahedral symmetry known as the Oh point group.
    Additive and multiplicative augmentation are also possible, but with all fields
    added or multiplied by the same factor.
    Input and target fields can be cropped.
    Input fields can be padded assuming periodic boundary condition.
@ -32,8 +35,10 @@ class FieldDataset(Dataset):
    """
    def __init__(self, in_patterns, tgt_patterns,
                 in_norms=None, tgt_norms=None,
-                 augment=False, crop=None, pad=0, scale_factor=1,
+                 augment=False, aug_add=None, aug_mul=None,
-                 cache=False, div_data=False, rank=None, world_size=None):
+                 crop=None, pad=0, scale_factor=1,
                 cache=False, div_data=False,
                 rank=None, world_size=None):
        in_file_lists = [sorted(glob(p)) for p in in_patterns]
        self.in_files = list(zip(* in_file_lists))
@ -72,6 +77,8 @@ class FieldDataset(Dataset):
        self.augment = augment
        if self.ndim == 1 and self.augment:
            raise ValueError('cannot augment 1D fields')
        self.aug_add = aug_add
        self.aug_mul = aug_mul
        if crop is None:
            self.crop = self.size
@ -121,18 +128,6 @@ class FieldDataset(Dataset):
        in_fields = [torch.from_numpy(f).to(torch.float32) for f in in_fields]
        tgt_fields = [torch.from_numpy(f).to(torch.float32) for f in tgt_fields]
        if self.augment:
            flip_axes = torch.randint(2, (self.ndim,), dtype=torch.bool)
            flip_axes = torch.arange(self.ndim)[flip_axes]
            in_fields = flip(in_fields, flip_axes, self.ndim)
            tgt_fields = flip(tgt_fields, flip_axes, self.ndim)
            perm_axes = torch.randperm(self.ndim)
            in_fields = perm(in_fields, perm_axes, self.ndim)
            tgt_fields = perm(tgt_fields, perm_axes, self.ndim)
        if self.in_norms is not None:
            for norm, x in zip(self.in_norms, in_fields):
                norm(x)
@ -140,6 +135,21 @@ class FieldDataset(Dataset):
            for norm, x in zip(self.tgt_norms, tgt_fields):
                norm(x)
        if self.augment:
            in_fields, flip_axes = flip(in_fields, None, self.ndim)
            tgt_fields, flip_axes = flip(tgt_fields, flip_axes, self.ndim)
            in_fields, perm_axes = perm(in_fields, None, self.ndim)
            tgt_fields, perm_axes = perm(tgt_fields, perm_axes, self.ndim)
        if self.aug_add is not None:
            add_fac = add(in_fields, None, self.aug_add)
            add_fac = add(tgt_fields, add_fac, self.aug_add)
        if self.aug_mul is not None:
            mul_fac = mul(in_fields, None, self.aug_mul)
            mul_fac = mul(tgt_fields, mul_fac, self.aug_mul)
        in_fields = torch.cat(in_fields, dim=0)
        tgt_fields = torch.cat(tgt_fields, dim=0)
@ -159,7 +169,11 @@ def crop(fields, start, crop, pad):
 def flip(fields, axes, ndim):
-    assert ndim > 1, 'flipping is ambiguous for 1D vectors'
+    assert ndim > 1, 'flipping is ambiguous for 1D scalars/vectors'
    if axes is None:
        axes = torch.randint(2, (ndim,), dtype=torch.bool)
        axes = torch.arange(ndim)[axes]
    new_fields = []
    for x in fields:
@ -171,12 +185,15 @@ def flip(fields, axes, ndim):
        new_fields.append(x)
-    return new_fields
+    return new_fields, axes
 def perm(fields, axes, ndim):
    assert ndim > 1, 'permutation is not necessary for 1D fields'
    if axes is None:
        axes = torch.randperm(ndim)
    new_fields = []
    for x in fields:
        if x.shape[0] == ndim:  # permutate vector components
@ -187,4 +204,28 @@ def perm(fields, axes, ndim):
        new_fields.append(x)
-    return new_fields
+    return new_fields, axes
 def add(fields, fac, std):
    if fac is None:
        x = fields[0]
        fac = torch.zeros((x.shape[0],) + (1,) * (x.dim() - 1))
        fac.normal_(mean=0, std=std)
    for x in fields:
        x += fac
    return fac
 def mul(fields, fac, std):
    if fac is None:
        x = fields[0]
        fac = torch.ones((x.shape[0],) + (1,) * (x.dim() - 1))
        fac.log_normal_(mean=0, std=std)
    for x in fields:
        x *= fac
    return fac
--- a/map2map/test.py
+++ b/map2map/test.py
@ -19,6 +19,8 @@ def test(args):
        in_norms=args.in_norms,
        tgt_norms=args.tgt_norms,
        augment=False,
        aug_add=None,
        aug_mul=None,
        crop=args.crop,
        pad=args.pad,
        scale_factor=args.scale_factor,
--- a/map2map/train.py
+++ b/map2map/train.py
@ -63,6 +63,8 @@ def gpu_worker(local_rank, node, args):
        in_norms=args.in_norms,
        tgt_norms=args.tgt_norms,
        augment=args.augment,
        aug_add=args.aug_add,
        aug_mul=args.aug_mul,
        crop=args.crop,
        pad=args.pad,
        scale_factor=args.scale_factor,
@ -92,6 +94,8 @@ def gpu_worker(local_rank, node, args):
            in_norms=args.in_norms,
            tgt_norms=args.tgt_norms,
            augment=False,
            aug_add=None,
            aug_mul=None,
            crop=args.crop,
            pad=args.pad,
            scale_factor=args.scale_factor,