¿Qué tan importante es el porcentaje de coincidencia en OkCupid?

Importante, pero no tan importante, por algunas razones matemáticas muy simples.

Primero, una introducción a cómo funciona el algoritmo de coincidencia si no está familiarizado con OKCupid.

Responde a un grupo de preguntas de opción múltiple cuando realiza su perfil (y si es como yo, también en los siguientes años [math] n [/ math] está en el sitio pero no tiene suerte). Para cada pregunta, le das a OKC 3 piezas de información:

  1. Su respuesta a la pregunta.
  2. La respuesta que te gustaría que tuviera tu pareja.
  3. Qué importante es la pregunta para ti.

Para un ejemplo concreto, tome la pregunta “¿Te gusta el sabor de la cerveza?”

Es posible que seas un caballero que bebe tequila y que odie el sabor del lúpulo y la malta por igual, así que respondes “no”. Pero leíste en el blog de OKTrends que las damas que disfrutan el sabor de la cerveza tienen más probabilidades de salir en una primera cita, algo de lo que sí disfrutas, por lo que preferirías que tu cita compre un Pilsner en lugar de un cosmo. . Usted dice que preferiría que su pareja respondiera “sí”. Pero como no estás completamente convencido de la fuerza de la correlación entre el sexo robusto, indicas que no es muy importante para ti.

Por lo tanto, su porcentaje de coincidencia está determinado por la forma en que sus respuestas de coincidencia potenciales cumplan con sus preferencias para sus respuestas y viceversa. Se llama algoritmo, por lo que debe ser super científico, ¿verdad?

Incorrecto.

El primer problema con el algoritmo de coincidencia es que se basa en las preguntas que ha respondido. Y francamente, las preguntas apestan . Fueron escritas por las personas que usaron el sitio cuando cambió de un sitio con pruebas estúpidas enviadas por el usuario a un sitio con pruebas estúpidas enviadas por el usuario que se utilizaron * como parte de una función de coincidencia. Inicialmente, ni siquiera se deletreaban. Los subliterados han desaparecido gradualmente del sitio, pero solo porque no se sugieren a nuevos usuarios. Los que se sugieren a los nuevos usuarios aún son ambiguos, están mal escritos y no reflejan especialmente lo que le gustaría saber sobre una posible cama y / o compañero de vida.

Los siguientes problemas son más sutiles y no tienen nada que ver con la calidad de la pregunta, sino con la estructura del propio algoritmo de coincidencia.

El segundo problema es el problema de la covarianza . Las preguntas no son un conjunto mínimo de la condición humana, por así decirlo. Las respuestas de las personas tenderán a agruparse fuertemente en función de la política, la religión, el estilo de vida y los rasgos de personalidad.

Por ejemplo, tome un eje de la condición humana: la amistad gay. La gente se ejecutará en este eje desde Fred Phelps hasta Elton John y probablemente querrás que tu cita se encuentre al menos en el mismo extremo que tú. Este eje de la condición humana corre en un ángulo de menos de [math] π / 2 [/ math] radians a ese otro eje importante: la religiosidad. (Es decir, cuanto más religioso seas, más probabilidades tendrás de caer más cerca de Phelps que de Sir Elton). Entonces, si has respondido “¿Es la homosexualidad un pecado?” Y “¿Te molestaría si un amigo gay del ¿El mismo sexo te dio un abrazo? “, respondiendo” ¿Con qué frecuencia lees la Biblia? “te dará mucha menos información que” ¿Te gusta el béisbol? ”

Sería difícil, pero no horroroso, y ciertamente no imposible, controlar esto, pero no veo evidencia de que el algoritmo tome en cuenta algún tipo de correlación. Por lo tanto, las personas con las que se “agrupa” tendrán una coincidencia artificialmente elevada% s con usted y las personas en un grupo diferente tendrán una coincidencia reducida artificialmente% s .

El tercer problema, relacionado con el segundo, es lo que yo llamo el problema de la cuestión del caníbal . Estas preguntas son muy informativas o superinformativas en función de si su coincidencia potencial responde de la manera “correcta”. Dicho en términos concretos, cuando se trata de la respuesta “¿Usted consume carne humana?”, “Sí” es extremadamente informativo para nuestro% de coincidencia, pero “no” no significa nada para nuestro% de coincidencia. Muchas veces estas son preguntas que rompen acuerdos, como “¿Estarías dispuesto a salir con una persona trans?” O “¿Crees en Dios?”, Pero no siempre. Nuevamente, estas preguntas tienden a inflar artificialmente el% de coincidencia. El hecho de que una persona cumpla con mis condiciones mínimas para tener una conversación, una pregunta real es esencialmente: “¿Asaltaría sexualmente a alguien si estuviera seguro de que no lo atraparían?”: No proporciona ninguna otra información sobre su idoneidad como socio, pero OKCupid lo considera igual de informativo como “¿Te gusta el béisbol?”

Nuevamente, sería posible alterar el algoritmo para controlar esto, pero no veo evidencia de que realmente lo hagan.

Y ahí es donde estamos parados. Si estás de acuerdo en que te emparejen con gente superficialmente como tú, el algoritmo funciona bastante bien. Si usted es un malhumorado de 120 celdas que no se lleva muy bien con otros de sus antecedentes, entonces podría estar escribiendo una larga misiva sobre las fallas matemáticas del algoritmo OKC a las 2 am en lugar de estar fuera con un dulce que conoció ahí. Así que tómelo con un grano de sal, recordando que es probable que los% s de alta coincidencia estén inflados artificialmente y que los% s de baja coincidencia se reduzcan artificialmente.

* Esta es la única situación en la que es aceptable usar la palabra utilizar : un verbo que significa cooptar algo para un nuevo propósito, posiblemente imprudente

Varía, pero en definitiva, no muy. El problema con la pregunta de OKCupid es que son tan blancos y negros y muchos se ven a sí mismos como si estuvieran en el área gris o deseando explicarse. En realidad, BuzzFeed tiene un video bastante bueno sobre esto. Una de sus personalidades tuvo citas con usuarios que OKCupid consideraba su “enemigo”. Los dos hablaron y en su mayor parte fueron simples malentendidos.

En lugar de centrarse en el porcentaje general, busque respuestas a respuestas específicas que le interesen como persona. Cuando estaba en OKCupid, las preguntas en las que me centraba se basaban en si una persona bebía y fumaba, la cercanía a su familia, la ética personal y la higiene en general, las preguntas religiosas simples, las pruebas de ITS / ETS y otras preguntas similares que tienen problemas simples. y respuestas en blanco.
¿Cuan a menudo te cepillas los dientes?
¿Con qué frecuencia te hacen la prueba de infecciones / enfermedades sexuales?
¿Con qué frecuencia asistes a la iglesia?

La otra cara de esto es que muchos usuarios solo responden de 5 a 10 preguntas, por lo que realmente no tienen mucha información para comparar.

“¿Qué tan importante es el porcentaje de coincidencia en OkCupid?”

Depende mucho de qué tan bien usted y las otras personas hayan respondido las preguntas.

Lo que es importante comprender acerca del sistema de concordancia es que el algoritmo se basa en la parte de las preguntas de “qué tan importante es esta pregunta para usted”.

Obtendrá los mejores resultados coincidentes si es muy bueno para calificar las buenas preguntas que considera importantes, calificar las buenas preguntas que considera no importantes, y no responder las malas preguntas en absoluto.

Hay muchas malas preguntas.

Mi consejo general es que no responda a las preguntas en la página de “contestar preguntas”, ya que tiene que leer tantas para llegar a las preguntas que son realmente relevantes.

En su lugar, mire las preguntas públicas de otras personas y responda las que realmente le parezcan importantes en una coincidencia (y califíquelas altamente).

Esto ayudará al sistema a coincidir con los valores que realmente importan a ambas personas y reducir el ruido de la gran cantidad de preguntas enviadas por el usuario mal escritas.


En última instancia, la calificación no es tan importante como comprender por qué la calificación es mala. Cuando te encuentres a gusto o algo con alguien donde la calificación es mala, profundiza en sus preguntas públicas y descubre por qué. Le dirá cuáles son sus respuestas incompatibles y lo que ellos y usted consideran importante.


Escribir (y leer) sobre preguntas contestadas puede ayudar mucho también. La mayoría de la gente lucha por escribir sobre ellos en sus perfiles. Puedes aprender mucho más por cómo hablan de sus respuestas a las preguntas.

Si completas las preguntas y respuestas, obtendrás una mejor coincidencia. Cuantas más respuestas completes, mejores serán las coincidencias. ¡Las respuestas son más reveladoras que los perfiles! No me molestaría con nadie que tenga menos de un 90% de coincidencia, y preferiblemente más que eso.

Cuando vea que una persona tiene una coincidencia del 98%, hojee el perfil pero luego vaya directamente a las Preguntas y Respuestas para obtener una imagen real del carácter y la personalidad de la persona.

Probablemente no, en base a mi experiencia. Me dijo que tenía una coincidencia del 80% con alguien en relación con el sexo, pero no tuvimos una respuesta similar; de hecho, ella dijo específicamente en sus propias respuestas que las respuestas que yo pondría se considerarían “perturbadoras” para su. Es el algoritmo de coincidencia más inexacto que he encontrado en un sitio de citas que trata de encontrarte de esa manera.