« Questions-r » : différence entre les versions
Aller à la navigation
Aller à la recherche
arrange question martiste 2
(arrange question martiste) |
(arrange question martiste 2) |
||
Ligne 98 : | Ligne 98 : | ||
mutate(data=purrr::map(data,~get_sequences(.,Temp=19))) %>% | mutate(data=purrr::map(data,~get_sequences(.,Temp=19))) %>% | ||
tidyr::unnest(cols=c(data)) | tidyr::unnest(cols=c(data)) | ||
</syntaxhighlight> | |||
Différence entre avec et sans '~' devant la fonction: | Différence entre avec et sans '~' devant la fonction: | ||
Ligne 114 : | Ligne 115 : | ||
L'utilisation des formules c'est un subtilité introduite pour gérer les fonctions qui n'ont pas les arguments "dans l'ordre le plus pratique au regard de ce qu'on souhaite faire". | L'utilisation des formules c'est un subtilité introduite pour gérer les fonctions qui n'ont pas les arguments "dans l'ordre le plus pratique au regard de ce qu'on souhaite faire". | ||
'''Question complémentaire''' | |||
Et, pour finir, si je veux en sortir 1) le nombre total de séquences, et 2) la durée de la séquence la plus longue, est-ce que tu me conseilles de l'inclure dans la fct 'get_sequences', ou de repartir des résultats de cette fonction et d'alimenter une nouvelle ? | Et, pour finir, si je veux en sortir 1) le nombre total de séquences, et 2) la durée de la séquence la plus longue, est-ce que tu me conseilles de l'inclure dans la fct 'get_sequences', ou de repartir des résultats de cette fonction et d'alimenter une nouvelle ? | ||
''' Réponse ''' | |||
Or, il est possible que tu veuilles utiliser les résultats de get_sequences tels quels (par exemple pour des graphiques) | Le nombre de total de séquences et la durée de la séquence la plus longue, ce sont des "agrégations" de ce que tu as fait avant. Or, il est possible que tu veuilles utiliser les résultats de get_sequences tels quels (par exemple pour des graphiques). Donc il vaut mieux faire en sorte que cette agrégation ait lieu dans un second temps => définition d'une nouvelle fonction par exemple. | ||
=> définition d'une nouvelle fonction par exemple | En revanche, je pense que tu pourrais faire tourner ce calcul avant de "unnest" car tes séquences n'ont pas des identifiants uniques en l'état (les identifiants ne sont uniques que au sein des sous-jeux de données imbriqués) | ||
En revanche, je pense que tu pourrais faire tourner ce calcul avant de "unnest" | |||
car tes séquences n'ont pas des identifiants uniques en l'état | |||
(les identifiants ne sont uniques que au sein des sous-jeux de données imbriqués) | |||
avec n_distinct, je chope le nb total de séquences | avec n_distinct, je chope le nb total de séquences | ||
Pour choper la durée de la séquence la plus longue, tu suggérerais quoi ? | Pour choper la durée de la séquence la plus longue, tu suggérerais quoi ? | ||
<syntaxhighlight lang="r"> | |||
... %>% | |||
group_by(sequence) %>% | |||
summarise(duration=max(time)-min(time)) %>% | |||
ungroup() %>% | |||
mutate(n_sequences=n()) %>% | |||
top_n(1,duration) | |||
</syntaxhighlight> | |||
le mutate (n_sequences=n()) te rajoute le nombre de séquences sans résumer (ça répète autant de fois que nécessaire la valeur n_sequences) | le mutate (n_sequences=n()) te rajoute le nombre de séquences sans résumer (ça répète autant de fois que nécessaire la valeur n_sequences) | ||
du coup après quand tu gardes que la top duration t'as quand-même l'info qu'il te faut | du coup après quand tu gardes que la top duration t'as quand-même l'info qu'il te faut | ||
== Annonces de nouveau packages R == | == Annonces de nouveau packages R == | ||