ValueError: Pomocou cieľového veľkosť (horák.Veľkosť([2, 1])), ktorá je odlišná od vstupného veľkosť (horák.Veľkosť([16, 1])) je zavrhované

Question 1

Snažím sa vytvoriť model pre Quora otázky pár dataset, kde výstup je binárne buď 1 alebo 0, ale ja som si to chyba. Viem, výstupný tvar môj model je odlišná od vstupného tvar, ale neviem, ako to opraviť. Dávka veľkosť nastavená na hodnotu 16

    class Bert_model (nn.Module):
      def __init__(self) :
        super(Bert_model,self).__init__()
        self.bert =  BertModel.from_pretrained('bert-base-uncased', return_dict=False)
        self.drop_layer = nn.Dropout(.25)
        self.output = nn.Linear(self.bert.config.hidden_size,1)
    
      def forward(self,input_ids,attention_mask):
        _,o2 = self.bert (input_ids =input_ids , attention_mask = attention_mask )
        o2 = self.drop_layer(o2)
        return self.output(o2)

    model = Bert_model()
    
    loss_fn = nn.BCELoss().to(device)

    def train_epoch(
      model, 
      data_loader, 
      loss_fn, 
      optimizer, 
      device, 
      n_examples
    ):
      model = model.train()
    
      losses = []
      correct_predictions = 0
      
      for d in data_loader:
        input_ids = d["input_ids"].to(device)
        attention_mask = d["attention_mask"].to(device)
        targets = d["target"].to(device)
    
        input_ids = input_ids.view(BATCH_SIZE,-1)
        attention_mask = attention_mask.view(BATCH_SIZE,-1)
    
        outputs = model(
          input_ids=input_ids,
          attention_mask=attention_mask
        )
    
        _, preds = torch.max(outputs, dim=1)
    
        targets = targets.unsqueeze(-1)
        loss = loss_fn(F.softmax(outputs,dim=1), targets)
    
        correct_predictions += torch.sum(preds == targets)
        losses.append(loss.item())
    
        loss.backward()
        nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
        optimizer.step()
        optimizer.zero_grad()
    
      return correct_predictions.double() / n_examples, np.mean(losses)

Chyby:

/usr/local/lib/python3.7/dist-packages/torch/nn/functional.py in
binary_cross_entropy(input, target, weight, size_average, reduce,
reduction)    2913         weight = weight.expand(new_size)    2914 
-> 2915     return torch._C._nn.binary_cross_entropy(input, target, weight, reduction_enum)    2916     2917  ValueError: Using a target
size (torch.Size([2, 1])) that is different to the input size
(torch.Size([16, 1])) is deprecated

Question 2

Z trasovanie zásobníka, chyba sa stane v BCELoss výpočty, je to kvôli tomu, že outputs.shape je (16, 1), zatiaľ čo targets.shape je (2, 1).

Vidím hlavný problém vo vašom kód: BCELoss používa sa na porovnanie rozdelenia pravdepodobnosti (pozrite dokumenty), ale model výstup má tvar (n, 1) kde n je veľkosti dávky (v prípade, 16). V skutočnosti pri návrate výkaz forward miniete o2 na lineárny vrstvy, ktorých výstupný tvar je 1.

Na Otázku, Páry Dataset je určený pre binárne klasifikácia úloh, takže budete musieť previesť svoj výstup do pravdepodobnosť, distribúcia, napríklad pomocou Sigmoid alebo nastavenie lineárne vrstva výstupná veľkosť 2, a potom pomocou softmax.

aretor · Answer 1 · 2021-11-21T15:50:29

Z trasovanie zásobníka, chyba sa stane v BCELoss výpočty, je to kvôli tomu, že outputs.shape je (16, 1), zatiaľ čo targets.shape je (2, 1).

Vidím hlavný problém vo vašom kód: BCELoss používa sa na porovnanie rozdelenia pravdepodobnosti (pozrite dokumenty), ale model výstup má tvar (n, 1) kde n je veľkosti dávky (v prípade, 16). V skutočnosti pri návrate výkaz forward miniete o2 na lineárny vrstvy, ktorých výstupný tvar je 1.

Na Otázku, Páry Dataset je určený pre binárne klasifikácia úloh, takže budete musieť previesť svoj výstup do pravdepodobnosť, distribúcia, napríklad pomocou Sigmoid alebo nastavenie lineárne vrstva výstupná veľkosť 2, a potom pomocou softmax.

Okrem toho si môžete prepnúť BCELoss s CrossEntropyLoss, ktoré je určené pre binárne klasifikácia problémy.
môžem zmeniť strata funkcie (BCEWithLogitsLoss), ktoré sa uplatňuje sigmoid na výstup , potom som stiahla softmax . problém stále existuje, ale teraz, pretože cieľová veľkosť (10,1) a líši sa od vstupu (16,1)
Je ťažké povedať, chyby z vášho kódu. Vzhľadom na to, že 16 je správne veľkosti dávky, starostlivo skontrolujte, keď váš cieľ zmeny veľkosti od 16. do 10. Vyhýbajte sa meniace telo vašu otázku inak odpovede budú nemá zmysel už.

ValueError: Pomocou cieľového veľkosť (horák.Veľkosť([2, 1])), ktorá je odlišná od vstupného veľkosť (horák.Veľkosť([16, 1])) je zavrhované

Otázka

Najlepšiu odpoveď

V iných jazykoch

Táto stránka je v iných jazykoch

Populárne v tejto kategórii

Obľúbené otázky v tejto kategórii