¿Cómo podría aplicarse mejor el aprendizaje automático a las aplicaciones de citas en línea?

Hay muchas formas de aplicar el aprendizaje automático (ML) a las aplicaciones / sitios de citas.

El principal problema con las citas es encontrar la pareja adecuada para aumentar las posibilidades de que una relación dure más tiempo.

Muchas personas tienen diferentes personajes que pueden determinar el fracaso o el éxito de una relación.

Sabemos que el aprendizaje automático es bueno en la clasificación. Por lo tanto, podemos convertir el problema de emparejamiento como un problema de clasificación y hacer suposiciones simplificadoras como:

  • La probabilidad de que dos personas sean una buena coincidencia depende únicamente de los atributos que son medibles.
  • Y que podemos medir esos atributos a partir de la información proporcionada por el usuario en su perfil, las relaciones pasadas y los patrones de qué tipo de personas están buscando.

Por supuesto, muchos de esos atributos son abstractos y difíciles de codificar en máquinas. Pero aquí es donde el LD puede ser más útil, no tenemos idea de cómo medir esos atributos porque algunos están definidos vagamente. Podemos usar ML para saber cómo afecta cada atributo a qué tan buena es una pareja para dos personas. Por lo tanto, solo necesitamos recopilar datos que contengan los atributos de las personas y las tasas de fracaso y éxito de sus relaciones.

Y podemos usar un diseño modular, dejar que cada atributo sea procesado por un módulo ML especializado y dejar que la decisión final sea tomada por un solo módulo “maestro”.

Dados los atributos de la persona A y el de la persona B, debemos determinar la probabilidad de que las dos personas, A y B, sean una buena coincidencia.

¿De qué atributos estamos hablando?

  • Apariencia.
  • Preferencias.
  • Sexo, ya sea masculino, femenino o transgénero.
  • Carrera.
  • Años.
  • Religión.

Todos estos atributos se pueden convertir en forma vectorial antes de pasar a un modelo de aprendizaje automático.

Por ejemplo, podemos usar una red neuronal convolucional (CNN) para extraer características de apariencia de alto nivel. La CNN puede convertir la apariencia en un vector descriptivo de alto nivel que codifica la apariencia de las personas. Un modelo de este tipo generalmente puede ser entrenado en la detección de personas y si aprende a detectar personas, probablemente haya desarrollado una buena representación intermedia de cómo se ven las personas. Por lo tanto, podemos tocar las características de cualquiera de los mapas de características convolucionales de alto nivel antes de la capa de clasificación final y usarlas como descriptores de apariencia de alto nivel.

La información de preferencia se puede encontrar en la descripción de las personas de sí mismos. Podemos usar el procesamiento de lenguaje natural (PNL) para extraer características de alto nivel que representan las preferencias de cada persona. El proceso puede involucrar word2vec y una red LSTM (memoria a corto plazo largo) que analiza las preferencias de las personas, en forma de texto escrito, en un vector descriptor.

Del mismo modo, otros atributos se pueden convertir en forma vectorial mediante un módulo especializado de red neuronal (NN).

En nuestro caso, la apariencia es manejada por una CNN y las preferencias por una LSTM.

Supongamos lo siguiente:

  1. Cada atributo se convierte en un vector. Dado un atributo [math] a_ {i} [/ math]. Necesitamos un módulo ML para convertir cada atributo en un vector [math] v_ {i} [/ math]. Llamemos a los vectores de atributos de [math] v [/ math]. Así que la apariencia puede ser [math] v_1 [/ math], preferencias [math] v_2 [/ math] y así sucesivamente.
  2. Luego podemos concatenar los vectores de atributos en un solo vector [math] V = [v_1, v_2,…, v_ {n}] [/ math] para n atributos. Llamemos a [math] V [/ math], el vector de coincidencia.
  3. Luego podemos alimentar el vector de coincidencia en un módulo maestro ML que genera la probabilidad. Si la probabilidad es alta, entonces A y B son una coincidencia válida, mientras que si la probabilidad es baja, A y B son una no coincidencia. Llamemos a esta probabilidad la probabilidad de coincidencia.
  4. Podemos entrenar el modelo de manera integral utilizando una gran cantidad de datos etiquetados.

En el momento de la inferencia, las probabilidades de coincidencia pueden ayudar a encontrar socios probables para un usuario en particular. Las coincidencias se pueden organizar en orden descendente de probabilidades de coincidencia.

De esta manera podemos tener una aplicación de Match Match con alta precisión.


Por supuesto, hay muchos atributos que pueden hacer o deshacer una relación y los seres humanos son muy buenos en una cosa, siendo impredecibles.

ML solo puede ayudar a relacionar personas basándose en algunas suposiciones simplificadoras y, por lo tanto, puede haber muchos casos de fracaso sin interacciones humanas reales.

Espero que esto ayude.

Vimos esto bastante extensamente con mi lanzamiento de inicio de citas.

En pocas palabras, entender cómo podría ayudar el aprendizaje automático comienza con entender qué están haciendo mal las aplicaciones actuales.

Aquí presentamos una tabla de resumen útil que se nos ocurrió:

¿Por qué las aplicaciones actuales son tan malas en esas cosas?

Algunos problemas centrales:

  • La gente miente.
  • La gente no sabe quiénes son.
  • La gente no sabe lo que quiere.
  • La gente no sabe expresar lo que quiere.
  • Las personas pueden no estar listas para lo que quieren.
  • La gente no tiene idea de su verdadero nivel de agua.
  • La gente miente.

Disminuyendo eso, todas las aplicaciones de citas dependen esencialmente de tus preferencias declaradas (es decir, tus “me gusta” en Facebook, respuestas de encuestas y cómo haces clic / deslizas) para descubrir quién eres y qué quieres.

Bueno, ¿y si esos datos son en su mayoría sin sentido (dados los problemas anteriores)?

Si bien el aprendizaje automático debería ser teóricamente capaz de superar a cualquier algoritmo fijo en la coincidencia, eso no es ni aquí ni allí si sus datos de entrada apestan.

Comenzando con esa hipótesis en mente, pensamos que un mejor modelo tendría que basarse en:

  • Recibiendo comentarios de amigos (que son mucho más realistas acerca de cómo podría ser una buena pareja y que pueden crear un perfil preciso para usted al completar las micro-preguntas en su nombre).
  • Eliminar la capacidad de los usuarios para mentir fácilmente (al agregar un sólido puntaje de confianza que penaliza la deshonestidad y bloquea efectivamente a los infractores reincidentes).
  • Usar rompehielos guiados para los chats iniciales (lo que nos permite analizar sus respuestas naturales para descubrir su pareja ideal).

Dicho de otra manera, el primer truco para ganar con el aprendizaje automático es proporcionar mejores datos (lo que requiere cambiar los diseños de las aplicaciones, ya que el modelo actual es horrible y no puede mejorarse sin repensar los fundamentos).

Ponemos en espera el lanzamiento indefinidamente para trabajar en otro proyecto, pero sospecho que el mercado irá en esta dirección de todos modos, tarde o temprano. Las preferencias declaradas simplemente no son buenos datos, lo que hace que la manera en que lo usas sea bastante irrelevante.

Hay muchos aspectos del uso de ML para aplicaciones de citas.

Por ejemplo, si está buscando conversiones de cuenta normal a cuenta premium.

Para que esto suceda, podemos mostrar una probabilidad de que una persona acepte (teniendo en cuenta la aplicación existente como un ejemplo Tinder: Swiping Right) si tiene una cuenta premium y compara esa probabilidad wtw con la cuenta normal. Si se muestran estadísticas de este tipo, creo que sería una decisión fácil para el cliente convertirlo en premium.

Otra perspectiva, si estamos buscando más registros, debemos dar un buen sistema de recomendación basado en su perfil y tenemos muchos algoritmos de desguace que pueden hacer ese trabajo para obtener los detalles de la persona, darle una buena recomendación.

Por otro lado, incluso puede ejecutar una campaña en línea para obtener información en línea, conversiones (número de registro) y muchos más.

Espero que mi respuesta sea de ayuda.

El aprendizaje automático se puede aplicar a cualquier problema en el que haya suficientes datos para aprender y donde los resultados del aprendizaje se puedan usar para predecir algo útil. Para las aplicaciones de citas, se puede utilizar para sugerir posibles coincidencias para sus usuarios en función de sus gustos y preciosos perfiles que el usuario ha “marcado correctamente”.

En lugar de preguntar si el aprendizaje automático es una buena herramienta para solicitar la aplicación de citas, debe preguntarse cuál es un buen problema para resolver en una aplicación de citas que brindaría el mayor beneficio a sus usuarios. Una vez que pueda responder a esta pregunta, observe todos los métodos de solución posibles que puede usar para resolver el problema y elija uno que sea rentable y funcione con la precisión que necesita. En ese proceso, es posible que se dé cuenta de que el aprendizaje automático es apto para un conjunto de problemas y no funcionará en otros.

En un sentido amplio, piense en el aprendizaje automático como un martillo. Se puede usar un martillo para solucionar muchos problemas en su vida, pero puede que no sea la mejor herramienta para cada trabajo. De manera similar, el aprendizaje automático puede usarse para encontrar una solución para muchos problemas, pero puede que no sea la mejor solución para un problema dado. En otras palabras, no haga la pregunta, ¿puedo aplicar el aprendizaje automático para resolver X. Desarrollará la mentalidad de que tengo un martillo y qué puedo resolver con él? Cada problema se verá como un clavo. En lugar de hacer la pregunta que tengo este problema, ¿cómo puedo resolverlo? Encontrará la mejor manera de resolver el problema y, en el proceso, aprenderá el pensamiento crítico necesario para encontrar y resolver problemas.

Me encanta la respuesta de Jeremy Arnold porque en realidad trató de hacerlo. Alguien con experiencia real en hacer esto es el sitio de citas en línea OK Cupid, y su blog es una lectura divertida y educativa sobre lo que aprendieron.

Por ejemplo, me encanta The REAL ‘Stuff White People Like’ – The OkCupid Blog y su publicación complementaria Race and Attraction, 2009–2014 – The OkCupid Blog que explora la “extracción de características” y la correlación en los perfiles. Y así es como usan ML para reducir el acoso y otras conductas problemáticas porque eres mejor que un Dick Pic – The OkCupid Blog

Las áreas que dependen del enorme trabajo algorítmico y de adivinación lógica son las áreas en las que se llama Aprendizaje automático para ayudarlo. La plataforma de citas debe coincidir y comparar los intereses individuales, las opciones de comida y entretenimiento, la elección de las palabras y el vocabulario y, a veces, el crecimiento del comportamiento, como las personas que gustan de las películas psicológicas que probablemente terminen gustando el género criminal y cosas por el estilo.

Si puede enseñar a su máquina cómo lidiar con estos problemas para construir un mejor algoritmo, no necesita codificar todo y terminará con parejas felices desde su aplicación mientras ahorra tiempo.

El principal problema que puede encontrar es que se necesitan muchos datos para entrenar una máquina / modelo, lo que para una puesta en marcha para principiantes puede ser una tarea difícil, sin embargo, es el futuro.

Si todas las parejas casadas pudieran ser encuestadas por un psicólogo capacitado y los factores principales que determinan qué hace que un matrimonio sea fuerte y qué causa el divorcio se determinen con mayor frecuencia, y los candidatos se evalúen de la misma manera, supongo que las coincidencias resultantes tendrían una ventaja . Asumiendo honestidad absoluta de TODOS los participantes.