Comments on: Generación de Texto en Español con GPT-2 https://aprendemachinelearning.com/generacion-de-texto-en-espanol-con-gpt-2/ en Español Mon, 02 Jan 2023 11:54:21 +0000 hourly 1 https://wordpress.org/?v=6.4.3 By: Jose Antonio https://aprendemachinelearning.com/generacion-de-texto-en-espanol-con-gpt-2/#comment-1717 Mon, 02 Jan 2023 11:54:21 +0000 https://www.aprendemachinelearning.com/?p=7869#comment-1717 El notebook me ha ido perfecto pero he tenido problemas con Python en Visual Studio Code porque no me instalaba Pytorch.
Al final resulta que Pytorch no funciona con la última versión de Python. Si que se instala bien con la 3.10.9. Parece que es un problema histórico y siempre van en Pytorch una versión por detrás de Python.

]]>
By: Na8 https://aprendemachinelearning.com/generacion-de-texto-en-espanol-con-gpt-2/#comment-1716 Sat, 31 Dec 2022 14:49:46 +0000 https://www.aprendemachinelearning.com/?p=7869#comment-1716 In reply to Pedro.

Hola Pedro, para la conversión usando Whisper sigue los pasos de esta notebook: Whisper to Youtube.
Me gustaría hacer un artículo sobre Whisper en el futuro.
Saludos!

]]>
By: Pedro https://aprendemachinelearning.com/generacion-de-texto-en-espanol-con-gpt-2/#comment-1715 Fri, 30 Dec 2022 18:41:32 +0000 https://www.aprendemachinelearning.com/?p=7869#comment-1715 Excelente post Juan!
¿Podrías contarnos como has realizado la transcripción automática de audio a texto en Whisper?

]]>
By: J.C.Rincon https://aprendemachinelearning.com/generacion-de-texto-en-espanol-con-gpt-2/#comment-1714 Mon, 19 Dec 2022 15:44:56 +0000 https://www.aprendemachinelearning.com/?p=7869#comment-1714 Excelente articulo. Muchas. muchas gracias.

Una duda, al entrenar, aparece que el attention mask no se configuraron. Sin embargo, veo que en la clase de entrada se establece:

self.attn_masks.append(torch.tensor(encodings_dict[‘attention_mask’]))

Cómo solventar el warning?

Gracias!!

======== Epoch 1 / 1 ========
Training…
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input’s attention_mask to obtain reliable results.
Setting pad_token_id to eos_token_id:50256 for open-end generation.
Batch 500 of 3,397. Loss: 0.18576528131961823. Elapsed: 0:06:19.
0: ladrones, aunque en este caso es que ha puesto, aunque no pueda, su vida patas arribas con que no es de su cuerda.
En fin, que me gustaría que fuese. a b. que son los de la de si si si. a mí que lo voy a decir.
– a mí que me encanta ser el mejor, y que le ponga un freno a su carrera, a la mía que, sin él, no quiero ser el mejor.
– ¡qué va! si a que soy el mejor y a lo que voy a decir, a ser el mejor. o sea, no sé qué pensar en mi casa, yo

]]>