Atención

Búsqueda avanzada
Buscar en:   Desde:
Identificación de rasgos de personalidad basado en el análisis del lenguaje natural mediante técnicas de machine learning
Arias Bisang, Alejandro, Crivello, Maria Del Carmen y Helguera, Gisela Paola.
XVII Congreso Internacional de Investigación y Práctica Profesional en Psicología. XXXII Jornadas de Investigación XXI Encuentro de Investigadores en Psicología del MERCOSUR. VII Encuentro de Investigación de Terapia Ocupacional. VII Encuentro de Musicoterapia. Facultad de Psicología - Universidad de Buenos Aires, Buenos Aires, 2025.
  Dirección estable:  https://www.aacademica.org/000-004/79
  ARK: https://n2t.net/ark:/13683/eNDN/cbE
Resumen
La evaluación de la personalidad tradicional enfrenta limitaciones de eficiencia y sesgos. El Aprendizaje Automático (ML) y el Procesamiento del Lenguaje Natural (NLP) ofrecen alternativas prometedoras para inferir rasgos a partir de texto, pero su validación en español es incipiente. Este estudio analizó la capacidad de un modelo LSTM, entrenado con el dataset PAN15 (textos de Twitter en español) y utilizando características TF-IDF/SVD, para predecir los Cinco Grandes Rasgos de Personalidad en una muestra de 59 universitarios hispanohablantes. Las predicciones se compararon con sus puntuaciones en el NEO-PI-R. Los resultados revelaron correlaciones significativas (p < .001) entre las predicciones del modelo y el NEO-PI-R para todos los rasgos, explicando una porción considerable de la varianza (R² ajustado: Neuroticismo=.510, Escrupulosidad=.464, Extraversión=.443, Agradabilidad=.397, Apertura=.344). El modelo también replicó intercorrelaciones estructurales conocidas. Contrariamente a lo esperado, el tipo de texto (redes sociales vs. autodescriptivo) no moderó significativamente la capacidad predictiva. Se concluye que el análisis lingüístico automatizado es viable para estimar rasgos de personalidad en español, aunque la precisión actual lo posiciona como una herramienta complementaria. Se destaca la necesidad de datasets más amplios y validación continua para su desarrollo futuro. Palabras clave Personalidad - Rasgos - Evaluacion - Machine learning ABSTRACT IDENTIFICATION OF PERSONALITY TRAITS BASED ON THE ANALYSIS OF NATURAL LANGUAGE USING MACHINE LEARNING TECHNIQUES Traditional personality assessment faces limitations regarding efficiency and bias. Machine Learning (ML) and Natural Language Processing (NLP) offer promising alternatives for inferring traits from text, but their validation in Spanish is nascent. This study analyzed the ability of an LSTM model, trained on the PAN15 dataset (Spanish Twitter texts) and using TF-IDF/SVD features, to predict the Big Five personality traits in a sample of 59 Spanish-speaking university students. Predictions were compared against their NEO-PI-R scores. Results revealed significant correlations (p < .001) between the model’s predictions and NEO-PI-R scores for all traits, explaining a considerable portion of the variance (Adjusted R²: Neuroticism=.510, Conscientiousness=.464, Extraversion=.443, Agreeableness=.397, Openness=.344). The model also replicated known structural intercorrelations. Contrary to expectations, text type (social media vs. self-description) did not significantly moderate predictive accuracy. It is concluded that automated linguistic analysis is viable for estimating personality traits in Spanish, although current precision positions it as a complementary tool. The need for larger datasets and continuous validation for future development is highlighted. Keywords Personality - Traits - Evaluation - Machine learning
Texto completo
Creative Commons
Esta obra está bajo una licencia de Creative Commons.
Para ver una copia de esta licencia, visite https://creativecommons.org/licenses/by-nc-nd/4.0/deed.es.