Il existe des conditions nécessaires à l'usage des modèles de survie dans les processus de renouvellement (je ne suis pas expert donc, n'hésitez pas à commenter).
De ce que j'ai compris, notamment:
1/ une estimation de la loi de survie sur l'intégralité de son support (et pas seulement sur l'intervalle de valeurs liées aux données d'apprentissage)
2/ la possibilité de simuler selon cette loi
Ces conditions ne sont aujourd'hui pas réunies dans l'implémentation des modèles non-paramétriques (e.g. KM), et de régression semi-paramétriques (e.g. Cox) de Relife, ce qui empêche leur utilisation conjointe avec les autres fonctionnalités de ce dernier. Mais il existe des travaux dans la littérature scientifique qui permettent d'y répondre.
De manière générale, je trouve dommage de cantonner ces modèles à un aspect purement "exploratoire" et non "prédictif", sous prétexte qu'ils obligent à faire des hypothèses en dehors des valeurs bornes issues de l'apprentissage. On peut vouloir y remédier au cas par cas (e.g. pourquoi pas à travers une mixture avec un modèle paramétrique dédié aux queues de distribution ?). La flexibilité de ces modèles les rend potentiellement plus précis qu'une hypothèse paramétrique inadéquate (ce qui n'est pas forcément le résultat d'un travail exploratoire incomplet, mais potentiellement une limite des modèles paramétriques disponibles).
Il existe des conditions nécessaires à l'usage des modèles de survie dans les processus de renouvellement (je ne suis pas expert donc, n'hésitez pas à commenter).
De ce que j'ai compris, notamment:
1/ une estimation de la loi de survie sur l'intégralité de son support (et pas seulement sur l'intervalle de valeurs liées aux données d'apprentissage)
2/ la possibilité de simuler selon cette loi
Ces conditions ne sont aujourd'hui pas réunies dans l'implémentation des modèles non-paramétriques (e.g. KM), et de régression semi-paramétriques (e.g. Cox) de Relife, ce qui empêche leur utilisation conjointe avec les autres fonctionnalités de ce dernier. Mais il existe des travaux dans la littérature scientifique qui permettent d'y répondre.
De manière générale, je trouve dommage de cantonner ces modèles à un aspect purement "exploratoire" et non "prédictif", sous prétexte qu'ils obligent à faire des hypothèses en dehors des valeurs bornes issues de l'apprentissage. On peut vouloir y remédier au cas par cas (e.g. pourquoi pas à travers une mixture avec un modèle paramétrique dédié aux queues de distribution ?). La flexibilité de ces modèles les rend potentiellement plus précis qu'une hypothèse paramétrique inadéquate (ce qui n'est pas forcément le résultat d'un travail exploratoire incomplet, mais potentiellement une limite des modèles paramétriques disponibles).