Los problemas con esto son dobles.
En primer lugar, es poco probable que sea eficaz. Si bien puede imaginar que los ingenieros de Google podrían extraer atributos útiles de los registros de búsqueda, como pasatiempos o intereses generales o una estimación aproximada de la edad, los datos que extraen serían ruidosos, escasos para algunos usuarios y propensos a errores. Con frecuencia, este modelo recogerá artefactos de los registros de búsqueda que están totalmente equivocados (la gente busca cosas que no les gustan tanto como las cosas que hacen). También es la forma más ineficiente y costosa de obtener tales datos: Google gastaría decenas de millones de dólares en el desarrollo de un modelo sofisticado que sería menos efectivo que lo que otros sitios de citas pueden obtener al hacer preguntas a sus clientes mientras establecen un perfil.
Un segundo problema, más serio, es que expondría inadvertidamente información personal. Eventualmente, el modelo clasificaría algo como una búsqueda médica como un pasatiempo, exponiendo un detalle personal íntimo a una fecha potencial, o peor al público.
Es por razones como esta que Google (así como Bing, Facebook y similares) tienen sólidas garantías contra el uso de registros de búsqueda en productos que puedan comprometer accidentalmente a sus clientes.