fix bugs

a3d277c8 · libei · 4b5dcaed · a3d277c8
Commit a3d277c8 authored Mar 19, 2019 by libei
--- a/tensor2tensor/models/transformer.py
+++ b/tensor2tensor/models/transformer.py
@@ -858,6 +858,7 @@ def transformer_before_shared25():
    hparams.learning_rate_warmup_steps = 8000
    hparams.optimizer = "MultistepAdam"
    hparams.optimizer_multistep_accumulate_steps = 4
+    hparams.encoder_layers = 25
    # it's likely to oom when you train deep transformer-pre-norm within 4096 batch_size
    hparams.batch_size = 2048
    return hparams