Hola Juanjo, no tengo nada escrito ahora mismo sobre eso, pero te paso este enlace por si te pudiera resultar de ayuda. Saludos.
]]>Hola Cristian, gracias por escribir y por suscribirte. Lo revisaré.
Saludos y disculpa la tardanza en responder
Hola Daniel, gracias por escribir. Debo decir que suelo estar con bastante poco tiempo libre últimamente, pero si quieres escríbeme desde el formulario de contacto y me describes en lineas generales cómo es tu proyecto y en qué podría ayudarles.
Saludos!
Hola gracias por escribir. Tengo entendido que hay varias opciones en catalán. Si puedes revisa este enlace que funciona con Spacy. Saludos!
]]>He leído tu post en el que analizas los cuentos de Hernan Casciari y me ha parecido muy interesante ya que no hay muchas publicaciones con textos en español. Concretamente me ha llamado la atención la parte en la que realizas un análisis de sentimiento. Ya que estás familiarizado con ello me gustaría preguntarte si dicho análisis podría aplicarse a textos en catalán o si por el contrario no existe ningún archivo que contenga stopwords o sentimientos «positivos y negativos».
Gracias de antemano,
Un saludo!
]]>Hola Na8, estoy escribiendo un programa para analizar el nivel de dificultad de un texto, ¿Interesado en colaborar?
]]>Estamos analizando un conjunto de 8,5 millones de datos en donde ya hemos aplicado limpieza con ER y agregado las Ñ y acentos que no venían. ahora debemos clasificar o tokenizar el texto…..y vimos «Reconocimiento de Entidades:», pero no hemos podido dar con el resultado, este dataset son direcciones en donde vienen escritas de diferente forma y con diferentes expresiones, por ejemplo «Av. Las Patatas # 1234, Melipilla», «1234 Las Patatas Melipilla», «1234 Patatas 803 Block Depto 42 Melipilla», «Las Patatas 1234 803 42 Block Melipilla», «Juan Soto 1234 Las Patatas 803 Block Depto 42 melipilla», etc. en resumen su direccion escritas de la forma que tu imagines…. y queremos identificar «Las Patatas», «1234», «Melipilla» y el resto del domicilio en un token «Block 803 Depto 42».
Tenemos un Maestro de Calles con su numeración, zip code, latitud y longitud…
Saludos
Rubén
]]>Como enfrentaría el proyecto de forma general? Gracias
]]>