Clean unnecessary files
This commit is contained in:
		| @@ -1,27 +0,0 @@ | ||||
| { | ||||
|   "data_name" : ["str",   "PTB"], | ||||
|   "data_path" : ["str",   "./data/data/penn"], | ||||
|   "emsize"    : ["int",   850], | ||||
|   "nhid"      : ["int",   850], | ||||
|   "nhidlast"  : ["int",   850], | ||||
|   "LR"        : ["float", 20], | ||||
|   "clip"      : ["float", 0.25], | ||||
|   "epochs"    : ["int",   3000], | ||||
|  "train_batch": ["int",   64], | ||||
|   "eval_batch": ["int",   10], | ||||
|   "test_batch": ["int",    1], | ||||
|   "bptt"      : ["int",   35], | ||||
|  | ||||
|   "dropout"   : ["float", 0.75], | ||||
|   "dropouth"  : ["float", 0.25], | ||||
|   "dropoutx"  : ["float", 0.75], | ||||
|   "dropouti"  : ["float", 0.2], | ||||
|   "dropoute"  : ["float", 0.1], | ||||
|  | ||||
|   "nonmono"   : ["int", 5], | ||||
|   "alpha"     : ["float", 0], | ||||
|   "beta"      : ["float", 1e-3], | ||||
|   "wdecay"    : ["float", 8e-7], | ||||
|  | ||||
|   "max_seq_len_delta" : ["int", 20] | ||||
| } | ||||
| @@ -1,27 +0,0 @@ | ||||
| { | ||||
|   "data_name" : ["str",   "WT2"], | ||||
|   "data_path" : ["str",   "./data/data/wikitext-2"], | ||||
|   "emsize"    : ["int",   700], | ||||
|   "nhid"      : ["int",   700], | ||||
|   "nhidlast"  : ["int",   700], | ||||
|   "LR"        : ["float", 20], | ||||
|   "clip"      : ["float", 0.25], | ||||
|   "epochs"    : ["int",   3000], | ||||
|  "train_batch": ["int",   64], | ||||
|   "eval_batch": ["int",   10], | ||||
|   "test_batch": ["int",    1], | ||||
|   "bptt"      : ["int",   35], | ||||
|  | ||||
|   "dropout"   : ["float", 0.75], | ||||
|   "dropouth"  : ["float", 0.15], | ||||
|   "dropoutx"  : ["float", 0.75], | ||||
|   "dropouti"  : ["float", 0.2], | ||||
|   "dropoute"  : ["float", 0.1], | ||||
|  | ||||
|   "nonmono"   : ["int", 5], | ||||
|   "alpha"     : ["float", 0], | ||||
|   "beta"      : ["float", 1e-3], | ||||
|   "wdecay"    : ["float", 5e-7], | ||||
|  | ||||
|   "max_seq_len_delta" : ["int", 20] | ||||
| } | ||||
| @@ -1,8 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   1800], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0001], | ||||
|   "LR"        : ["float", 0.2] | ||||
| } | ||||
| @@ -1,8 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0005], | ||||
|   "LR"        : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   64], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0001], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0005], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 16], | ||||
|   "drop_path_prob" : ["float", 0.2] | ||||
| } | ||||
| @@ -1,14 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "cosine"], | ||||
|   "batch_size": ["int",   96], | ||||
|   "epochs"    : ["int",   600], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0003], | ||||
|   "LR"        : ["float", 0.025], | ||||
|   "LR_MIN"    : ["float", 0.0001], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "cutout"    : ["int", 0], | ||||
|   "drop_path_prob" : ["float", 0.3] | ||||
| } | ||||
| @@ -1,15 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "steplr"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   250], | ||||
|   "decay_period": ["int",   1], | ||||
|   "gamma"     : ["float", 0.97], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.00003], | ||||
|   "LR"        : ["float", 0.1], | ||||
|   "label_smooth": ["float", 0.1], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "drop_path_prob" : ["float", 0] | ||||
| } | ||||
| @@ -1,15 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "steplr"], | ||||
|   "batch_size": ["int",   256], | ||||
|   "epochs"    : ["int",   250], | ||||
|   "decay_period": ["int",   1], | ||||
|   "gamma"     : ["float", 0.97], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.00003], | ||||
|   "LR"        : ["float", 0.1], | ||||
|   "label_smooth": ["float", 0.1], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "drop_path_prob" : ["float", 0] | ||||
| } | ||||
| @@ -1,15 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "steplr"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   250], | ||||
|   "decay_period": ["int",   1], | ||||
|   "gamma"     : ["float", 0.97], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.00003], | ||||
|   "LR"        : ["float", 0.1], | ||||
|   "label_smooth": ["float", 0.1], | ||||
|   "auxiliary" : ["bool", 1], | ||||
|   "auxiliary_weight" : ["float", 0.4], | ||||
|   "grad_clip" : ["float", 5], | ||||
|   "drop_path_prob" : ["float", 0] | ||||
| } | ||||
| @@ -1,10 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "multistep"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   300], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0001], | ||||
|   "LR"        : ["float", 0.1], | ||||
|   "milestones": ["int",   [150, 225]], | ||||
|   "gammas"    : ["float", [0.1, 0.1]] | ||||
| } | ||||
| @@ -1,10 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "multistep"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   300], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0001], | ||||
|   "LR"        : ["float", 0.5], | ||||
|   "milestones": ["int",   [150, 225]], | ||||
|   "gammas"    : ["float", [0.1, 0.1]] | ||||
| } | ||||
| @@ -1,10 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "multistep"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   165], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0001], | ||||
|   "LR"        : ["float", 0.01], | ||||
|   "milestones": ["int",   [1, 83, 124]], | ||||
|   "gammas"    : ["float", [10, 0.1, 0.1]] | ||||
| } | ||||
| @@ -1,10 +0,0 @@ | ||||
| { | ||||
|   "type"      : ["str",   "multistep"], | ||||
|   "batch_size": ["int",   128], | ||||
|   "epochs"    : ["int",   200], | ||||
|   "momentum"  : ["float", 0.9], | ||||
|   "decay"     : ["float", 0.0005], | ||||
|   "LR"        : ["float", 0.01], | ||||
|   "milestones": ["int",   [1 ,  60, 120, 160]], | ||||
|   "gammas"    : ["float", [10, 0.2, 0.2, 0.2]] | ||||
| } | ||||
		Reference in New Issue
	
	Block a user