Bonjour Ă tous,
suite Ă des problĂšmes dâinstabilitĂ©, venant dâune utilisation Ă 100% du disque et Ă un alerting qui ne fonctionnait malheureusement plus, jâai Ă©tĂ© obligĂ© de mettre lâinstance offline pour une durĂ©e dâenviron 48h de maniĂšre soudaine et impromptue.
Lâinstance fonctionne dorĂ©navant avec un stockage dâimages sur s3, un service tiers gĂ©rĂ© par Wasabi, au lieu dâun stockage sur le serveur lui mĂȘme.
AprĂšs une phase de vĂ©rification que tout re-fonctionne, je procĂ©derais dans la foulĂ©e Ă la MAJ de lâinstance vers la derniĂšre version dâici quelques heures.
â
Pour le post mortem à destination de ceux que ça intéresse :
Lemmy stocke par défaut les miniatures et images fédérées via toutes les instances en local.
Ă la crĂ©ation de lâinstance, la place donnĂ©e par les crĂ©ateurs de lemmy nĂ©cessaire au bon fonctionnement dâune instance Ă©tait aux alentours de 40gb.
Ă partir de cette information, jâai dimensionnĂ© lâinstance avec ce quâon peut considĂ©rer ĂȘtre un petit disque, mais en RAID pour pouvoir ĂȘtre plus rapide, dâune taille dâenviron 500gb, donnant tout de mĂȘme une marge de x10 par rapport aux specs demandĂ©es.
Il sâavĂšre quâavec lâessor de lemmy et sa popularitĂ©, le stockage dâimage prend maintenant aux alentours des 350gb, pour environ 3 500 000 objets, saturant ainsi lâespace disque et rendant lâinstance instable.
Ceci arrivant bien Ă©videmment la veille de mes vacances loin de chez moi, jâai tentĂ© de faire un peu de place avant de partir, mais cela nâa pas Ă©tĂ© suffisant.
Afin de pouvoir avoir un peu de marge de manĆuvre Ă mon retour, jâai dĂ» faire encore une fois le mĂ©nage et tout couper pour garder de lâespace pour pouvoir tout simplement faire quoi que ce soit sur lâinstance.
LâopĂ©ration principale Ă©tant la migration de toutes ces images gĂ©rĂ©es par le service pict-rs de lemmy du disque vers un service cloud, qui a Ă©tĂ© trĂšs laborieux, la version de pict-rs utilisĂ©e Ă©tant complĂštement cassĂ©e au niveau de la migration.
Jâai donc dĂ» mettre Ă jour la version de pict-rs et la migration sâest ensuite, a priori, passĂ©e sans plus de problĂšme.
Maintenant que lâopĂ©ration pompier est terminĂ©e, je vais profiter des diffĂ©rents ponts pour mettre en place des alertes qui fonctionnent mieux, et tenter de fiabiliser un peu plus lâinstance.
â MAJ du 27/04 Ă 16h33
La migration vers la version 0.19.11 est maintenant faite, nâhĂ©sitez pas Ă remonter tout problĂšme.
!jlailu_statut@sh.itjust.works
Ăa pourrait peut-ĂȘtre ĂȘtre ajoutĂ© sur la page dâaccueil quand lâinstance est indisponible.
Ouaip ça a Ă©tĂ© discutĂ©, avoir les liens qui vont bien sur la page dâerreur ou de maintenance.
Ceci dit ça ne fonctionne que si on va directement sur le site jlai.lu, avec une application lemmy tierce il nây aura pas lâinformation.