—
TIMECODE :
Partie 1 : Introduction et présentation de Click House : 00:00
Partie 2 : Démonstration de Click House : 13:13
Partie 3 : Le parcours de Melvyn, la vie chez Click House,.. : 31:52
bonjour à tous je suis Nicolas Cholet je suis le fondateur de hest qui une société de conseil en data marketing et aujourd’hui j’ai la chance de recevoir Melvin pignon melv je te laisse te présenter bonjour donc je m’appelle Melvin je suis product manager à clickh depuis maintenant 2 ans et demi ravi de parler Nicol merci alors une toute petite intro avant de commencer juste pour je raconter ce qui est kckous mais moi comme je suis pas très très bon là-dedans mvine il fera mieux ça mieux que moi mais pourquoi je trouve que c’est intéressant en gros dans dans la data nous cheest en tout cas on travaille beaucoup avec les Data Warehouse modernes qu’on appelle modne parce qu’ils sont dans la moderne dat stack ça va être Google bquery chez chez Google redshift chez Amazon databrix ou ou Azure syap chez Microsoft souvent euh et en fait c’est un monde et il y a snowfleake aussi donc c’est un monde finalement de une sorte d’oligopole avec tris quatre acteurs et il y a un acteur je trouve très intéressant qui a émergé euh depuis quelques temps qui s’appelle clickhous euh mais lui n’ en parlera mieux que moi et donc bah là le but aujourd’hui on va on va aborder plusieurs sujets l’un des sujets c’est malwiine va justement parler de clickous ce que c’est à quoi ça sert qui achète ça et et tout ça et puis après on parlera un peu plus de de du parcours justement de malvine quoi consiste t job comment ça fonctionne une boîte comme ça logiciel américaine euh qui est distribuée un peu partout dans le monde euh voilà je trouve ça hyper intéressant donc on va essayer d’aborder un petit peu t tous ces sujets euh mais d’abord bah min du coup je je vais revenir avec ma question c’est est-ce que tu peux nous raconter un peu ce qui est clickhous ce que ça fait et et tout ça ouais donc clickhous pour résumer c’est vraiment enfin c’est une base de données donc pour pour dire les mots simplement c’est c’est une base de données maintenant il y a des centaines peut-être des milliers de bases de données disponibles aujourd’hui euh donc quelle est la la différenciation qu’apporte clickhous par rapport on va dire à des à du Oracle ou d’autres d’autres bases de données c’est que clickout va vraiment être spécialisé pour un type de un type de de charg qui sera des charges analytiques pour des query analytiques donc euh quand on veut par exemple initialement ça a été développé pour répondre à des problèmes de web analytique donc c’est-à-dire qu’on veut on a de plein d’événements euh qui se passent sur des sites internet et on veut pouvoir avoir un résumé de de toute l’activité qui se passe pour avoir savoir d’où viennent nos utilisateurs euh quel est quels sont les les les les les les sources de sources d’origine du trafic donc on voulait vraiment avoir initialement ce genre d’information donc click a été développé euh pour pour ce pour ce cas d’usage donc pour pour répondre à à à la au web analytique en en 2009 donc c’était prototypé à ce moment-là et au fur et à mesure donc ça a été développé euh ça a été développé continuement jusqu’en 2016 où on a commencé à décider de de rendre le projet open source et en 2016 on l’a rendu open source sous une licence Apache 2.0 euh et euh à ce moment-là donc ça a été euh euh adopté par la par la communauté parce qu’il y avait très peu de de base de données analytiques euh qui étaiit disponible en open source hein donc il y a fondamentalement si on regarde aujourd’hui l’écosystème la majorité des des des outils qui qu’ avait bah étaient tous euh très peu orientés open source et donc clickhous était vraiment une une des plus grosses base de données pour l’analytique qui qui était Open Source eTTH donc on a fait énormément de releas en entre 2016 et 2021 et en 2021 on a on a créé une entreprise donc autour de clickhous euh on a on a recruté l’équipe de développement qui avait initialement euh qui avait initialement développé clickhouse on a on a combiné nos forces avec d’anci des anciens employés qui ont l’habitude de de vendre des je dirais des logiciels avec une avec une go to go une goto market stratégie qui est assez assez développé et on a créé cette entreprise donc clickh en 2021 et à ce moment-là donc vraiment on a on a commencé à à développer une solution Cloud donc où les gens peuvent utiliser clickhouse pour faire de l’analytique directement dans le Cloud sans avoir à déployer et à maintenir maintenir click sa version open source euh et tu parlais justement un peu avant aussi de la modern datastack et où on se positionne par rapport à la moderne dat stack donc on est vraiment sur les mêmes segments que que que bigquery que snowflake que redshift je dirais la différence ou vraiment la la spécialisation de clickh c’est qu’on va se spécialiser donc dans les dans les charges de travail de d’analytique mais aussi les charges de travail en real time donc c’està dire que on veut vraiment vraiment être uidé qu on va avoir des des latences de C qui sont extrêmement faibles donc de l’ordre de la milliseconde et peut-être secondes dans dans certains scénarios euh et pour des volumes de données qui sont vraiment qui sont vraiment énormes donc aujourd’hui on a des clients qui utilisent clickhouse pour on va dire pour euh pour euh euh pour générer des dashboards en temps réel pour leurs clients donc par exemple dans dans le monde de la finance euh pour pour pour par exemple pour surveiller des le le cours de certaines actions ou pour surveiller le cours de certaines cryptos euh on est extrêmement utilisé par toutes les les les les entreprises qui sont dans le le dans l’environnement crypto parce que bah justement clicker c’est vraiment de très bonnes performances pour cette faible latence et euh et cette capacité à gérer des des larges des des volumes de données qui sont extrêmement extrêmement large OK et quand tu dis faible latence c’est en en écriture ou en lecture plutôt là tu parles plutôt de la lecture donc on on parlera surtout de la lecture euh ensuite la l’avantage quand par exemple quand tu quand tu compares euh click House et euh on va dire snowflake par exemple c’est euh ça sera aussi en en écriture pour certains scénarios par exemple pour les matérialu click va pouvoir faire ce genre de matéal l’injestion les matérialu en temps réel alors que alors que par exemple snowflag lui va le faire avec un un petit délai pour pouvoir regrouper euh regrouper les données faire du batch processing CIS que par des par défaut clicas doit snowfleake doit le faire toutes les 60 secondes par exemple toutes les matériel Asus sonont rafraîchis avec cl auss c’est au moment de l’insertion donc euh toutes les mat qui qui sont déployés en cascade vont être vont être matérialisés ok c’est à la fois en écriture et aussi en lecture ok donc les cas d’usage c’est plutôt des gens qui ont énormément de de log de données j’imagine donc tu parlais de Web Analytics à l’origine mais ça peut être imagine Quand tu es dans la telco je sais pas tous t appels téléphoniques passés par les gens dans la finance j’imagine pareil transaction ce genre de chose et c’est plutôt du dashboarding derrière l’utilisation donc en fait euh c’est c’est exactement ça donc quand ça quand click house étécré initialement c’était vraiment pour de de de du web analytic c’était pour créer un produit qui soit compétiteur à compétitif à à à Google analytic donc c’était c’était vraiment purement web analytique mais quand on l’a quand on l’a rendu Open Source en en 2016 on s’est aperçu qu’en fait la communauté a commencer l’utiliser dans dans dans une variété de use case qui était vraiment bah toujours dans ce secteur de l’analytique mais euh mais par exemple appliquer à à d’autres charges de travail donc par exemple aujourd’hui n nos plus gros utilisateurs euh si si s’il regarde seront par exemple des acteurs de l’observabilité donc par exemple on va avoir SC prix qui va utiliser clickhous pour stocker tout tout tout tous leurs tous leurs événements leurs log et cetera euh un un de nos plus gros utilisateurs aussi est Netflix euh qui va lui ingérer jusqu’à 1 1.6 pabit de données par jour donc clickhous euh pour faire de pour faire du monitoring de de de de leur de leurs événements et de leur de de leur application euh donc en temps réel et donc derrière ça derrière bien sûr derrière c’est toutes ces toute cette charge de travail va y avoir des dashboards qui vont utiliser internellement pour pour pour surveiller euh surveiller leurs applications leur leur leur release leur mise en production et cetera donc c’est c’est vraiment des des des des cas d’utilisation qui sont purement analytiques en général pour on va voir avoir beaucoup de de gros volumes mais ça marche aussi avec des des petits volumes euh et donc en fait à partir du moment où les gens ont données et que ils veulent construire éventuellement des dashboards donc que ça soit euh je dirais face client ou face équipe interne ça ça a pas vraiment de différence ils sont vraiment ce qui est te pour eux c’est vraiment d’avoir une une très faible lence ok ok ok et moi j’avais enfin j’avoue je m’étais intéressé avec claos aussi sur un peu des sujets de souveraineté des données ou une maîtrise des données à un moment où alors c’est peut-être très français comme truc mais euh des gens avaient des des un peu de problèmes à confier leur données notamment à Google euh et puis en fait bah il y avait pas trop d’alternative en fait puisque tous les acteurs que que tu as cité hein sur les fournisseurs de grosse base de données analytiques dans le Cloud sont américains euh et puis moi j’ai eu cette solution open source et finalement je voyais ça comme une alternative pour cette raisonlà est-ce que c’est un des arguments aujourd’hui ou pas est-ce que c’est ça fait partie des choses que vos clients viennent rechercher euh c’est souvent en fait on va avoir je dirais on va vraiment avoir je dirais trois trois types d’utilisateurs donc on va avoir les les les les utilisateurs qui sont cloud natif donc c’est des gens des entreprises qui sont assez récentes qui en fait dès leur naissance veulent veulent mettre tout leur use case directement dans le Cloud donc on va avoir ce ce ce type d’utilisateurs qui vont être très présents dans bah dans notre cloud donc il vont vont besoin d’utiliser clickhouse pour c’est pas un problème de déployer un service sur AWS bigquery Azure bien sûr ils vont avoir des ils vont avoir des des restrictions en terme de ils vont essayer de aliser tout le tout leur tous leurs services autour d’un d’un cloud provider pour bénéficier justement de discount que les cloud provider vont fournir en fonction des des charges de travail qui vont qui vont appliquer sur sur le le le Cloud provider mais donc ça c’est le ça sera notre premier type de de client donc c’est des gens qui peuvent déployer le leur application dans le Cloud sans sans problème ensuite on va voir un peu les les les utilisateurs qui sont historiquement sur des sur des scénarios selfmanage euh mais qui ont de plus en plus tendance à vouloir évoluer vers une solution Cloud ou une solution managée et donc ça c’est avec O on va travailler sur comment est-ce qu’on peut les aider à migrer donc euh tout toute leur charge de travail qui est sur du self manage vers le Cloud euh dans sans simplifiant le leur transition et ensuite on va vooir j’ait un troisème type d’utilisateur qui eux en fait sont sont des utilisateurs qui ont des données extrêmement sensibles donc qui peuvent pas éventuellement euh quitter leur leur leur leur prémisses et donc il doivent être sur du euh sur du self manag on préise et dans ce cas-là on va avoir on va pouvoir travailler justement avec la distribution open source pour les supporter dans leur dans leur dans leur dans leur scénario on va on va on va principalement s’occuper que des des comptes qui sont assez gros faire un faire une entreprise autour d’un modèle self manage sur des petits comptes c’est c’est extrêmement difficile parce que ça implique beaucoup de beaucoup de développement euh par exemple il va falloir du télémétrie il va falloir développer un modèle de licence euh qui soit très spécifique et très facilement able à plein plein de différents scénarios donc vraiment pour les scénarios selfmanagement on va vraiment s’occuper que des des comptes on va dire stratégiques donc typiquement des comptes comme par exemple des banques la Deutch Bank par exemple qui qui est un uisateur de KCK House qui et aussi pour pour certains scénarios va vouloir utiliser le le Cloud et donc ils vont ils vont mettre certaines charges de travail dans notre cloud mais vont aussi avoir des scénarios où ils ne pourront pas mettre les données dans dans le Cloud et du coup on va aussi les aider à supporter leur leur leur scénario sur du self manage mais justement le fait qu’on soit un model Open Source ça ça fournit un peu cette flexibilité au clients ils ont aussi la la la la l’assurance bah de de ne pas être lockin dans le Cloud et de pouvoir migrer assez facilement par exemple vers retourner sur du self manage éventuellement ou alors se retourner vers un nouveau cloud provider ce qui est pas forcément le cas par exemple quand tu utilises du quand tu ise par exemple du snowflex ou du bigquery ou du red shift euh parce que si tu as développé toute ton ton application sur du red shift et que demain bah tu veux tu veux sortir de de l’écosystème AWS bah il va falloir que tu réimplémentes tout ton application toute la logique d’ d’application puisque redshift n’est pas open source et par exemple pour pour se déplacer de redift vers bigquery tu vas avoir une une certaine euh euh migration que tu vas devoir faire qui va éventuellement prendre du temps et et et et coûter de l’argent donc euh ça c’est c’est c’est c’est aussi un des avantages que click fournit d’avoir cette distribution open source qui est vraiment 100 % compatible avec notre offre cloud aussi ok h clair et ben du coup est-ce que enfin j’avais demandé de préparer une démo alors c’est jamais évident des démos de de base de données mais tu m’as dit que tu t’étais prêté au jeu donc j’ai j’ai hâte de voir ça donc je vais partager mon [Musique] écran je vais juste partager ce je partage bonne fenêtre est-ce que tu peux voir mon écran maintenant ouais tout à fait c’est en train’fficher c’est bon très bien donc ça c’est notre service cloud donc dans notre service cloud on va pouvoir créer ce qu’on appelle des services don je montrer à peu près comment est-ce qu’on on peut créer un service on peut choisir éventuellement notre notre cloud provider vous pouvez choisir entre AWS GCP ou Azure et dans CL providers vous allez pouvoir choisir votre votre région donc là je vais prendre un WS pour l’exemple on va prendre vous allez devoir donner un nom à votre à votre service donc ici on va l’appeler démo et une fois que vous avez choisi votre service vous pouvez créer un service et qu’est-ce que ça va ça va on va déployer un un service dans dans le Cloud que vous avez sélectionné donc je vais retourner sur la la page d’accueil donc ça c’est le nouveau service que je viens de créer j’en ai déjà créé un pour pour le pour pour préparer la démo donc j’ai appelé uness demmo et en fait ce service là euh donc est composé de de plusieurs c’est un cluster clickhous donc composé de plusieurs nœuds donc qui sont distribués sur plusieurs zones de disponibilité donc pour garantir une haute disponibilité du service donc s’il y a un nœud qui tombe le service reste actif et ce que je vais faire c’est que euh aujourd’hui j’ai créé euh j’ai créé un topic kaaveka qui va contenir des des des données dynamiques euh des événements qui vont arriver dans mon topic Kafka euh qui sont des des données he qui sont pas des des vraies données mais des données euh euh qui sont des données de simulation et euh on va euh streamer donc ces données qui sont dans notre topic KK vers clickas et ensuite on va les analyser dans dans par exemple grafana euh donc ce ce serv attends attends petite peut-être petite traduction euh alors j’avoue en plus Kafka je pense enfin je suis pas extrêmement familier si je me trompe pas en gros c’est écoute des des messages c’est ça euh caveka et en fait quand tu reçois un message du coup tu pousses euh les données que tu as reçu dans ce message dans ta base c’est ça ça donc c’est c’est clickous en fait va récupérer les données dans dans ce topic Kafka donc Kafka va stocker ses ses données dans dans un topic et clickous va récupérer ces données euh dans dans dans ce topic euh les stocker dans la base de données et ensuite on on va pouvoir visualiser ça dans dans dans grafana ok donc c’est une manière finalement de d’ingérer de la donnée dans euh ouais enami plus que en BCH par exemple c’est ça donc c’est c’est en fait c’est souvent ce qu’on c’est c’est souvent ce qu’on va voir c’est un plot qu’on va voir euh très très fréquemment chez chez nos utilisateurs donc euh ils vont avoir évuellement une une queue comme comme Kafka où ils vont pouvoir stocker tous leurs événements et avoir plusieurs consumeerss qui vont pouvoir éventuellement consommer de cette queue en fonction de des différents euh en fonction des différents utilisations qu’ils ont des données donc il vont par exemple insérer dans leur base de données mais éventuellement aussi envoyer ses données dans dans dans dans par exemple dans une application qui qui qui a besoin de de de de processer éventuellement de transformer ses données et puis en fait les storer dans du du stockage permanent donc c’est c’est un c’est un un un modèle de données qu’on voit assez fréquemment et qui je pensais qui était intéressant à montrer pour pour tout le monde donc euh donc le le but ce qu’il va falloir faire dans dans clickh la première chose qu’on do faire c’est on va créer un dat source donc qui en fait va déployer une infrastructure de notre cloud euh avec un consum avec un consumeur qui va pouvoir consumer justement cette cette ce ce topic Kafka donc je vais commencer à à créer mon dat source je vais j’ai plusieurs dat sources qui son qui sont qui sont disponibles donc on a par exemple du Amazon S3 donc si vous avez tout vos données dans dans du S3 on va pouvoir utiliser ça directement ici on va utiliser conf cloud donc je vais donner un nom à mon intégration donc je vais l’appeler démo je vais lui donner une APPI que j’ai préalablement euh copier ici et je vais prendre le secret que je vais copier ici et ensuite on va pouvoir choisir on va fallir spécifier le endp de mon de mon de mon cluster de mon cluster kaavka donc je vais pouvoir le récupérer ici je vais récupérer mon endp et je vais le mettre ici et donc une fois que j’ai configurer mon j’ai juste mis mon appy et mon endpoint je vais pouvoir cliquer sur comm une data et donc là il va checker il va checker la la le le mon cluster Kafka me montrer les différents topiques qui me sont qui sont disponibles donc ici j’en ai qu’un seul qui est le simple data et donc là il va me montrer les des exemples de messages qui sont dans dans mon dans mon topic donc là je vais par exemple avoir un exemple de message qui est celui-ci donc maintenant ce que je vais pouvoir faire je vais pouvoir parcer les informations qui viennent de mon topic Kafka et donc clickp va me proposer euh qui va me proposer mon mon mon schéma de données pour ma table qui va me donner deux options ou bien je veux stocker ces données dans une nouvelle table ou alors dans une table qui existe déjà donc là j’ai choisir une nouvelle table on va appeler cette table qui va s’appeler simple data et on va devoir spécifier une certainting key qu’est-ce que c’est qu’une certainting key qu’est-ce que qu’est-ce qui va permettre à clickh de donner une vraie une vraie faible latence en fait ça va être cette sorte qui qui va en fait trier les données sur disque donc c’està dire que quand vos données vont arriver dans clickhous elles vont être euh triées en mémoire et ensuite elles vont être euh écrites sur disque avec ce en fonction de cet ordre de tri et donc en fait quand vous vous allez faire vos query vous allez faire vos queries principalement avec cette avec des conditions dans votre filter close là donc quand vous allez écrire votre votre query SQL vous allez mettre whereare et ensuite vous allez spécifier des conditions euh si cette condition contiennent cette de cette cette clé de tri bah on va pouvoir justement en fait récupérer les les bonnes les bonnes données extrêmement rapidement puisque par que les données sont déjà triées sur disque euh au moment de l’écriture donc là je vais choisir si je comprends bien c’est un peu l’équivalent dans une base de données moteur de recherche classique d’un d’un index mais sauf que là tu le fais sur finalement la colonne que tu veux et non pas forcément sur une colonne dédiée à indexation ou un truc comme ça quoi c’est ça c’est pas forcément une une colonne ça peut être un ensemble de colonnes par exemple ça peut être une clé composite donc tu peux avoir plusieurs plusieurs colonnes dedans euh mais exactement ça ça va très similaire à un index d’ailleurs on va laisser on va l’appeler ça l’index primaire euh c’est cette clé et euh et va pas créer un index dense elle va créer un index qui qu’on appelle spars donc justement au lieu en fait d’avoir une entrée pour chaque chaque ligne il va créer une entrée pour toutes les CIS c’est le 8192 lignes à peu près euh donc ça va permettre d’avoir un un index qui soit qui soit Spar donc qui soit moins volumineux et en fait tu vas toujours avoir ces mêmes caractéristiques he vu que tes données sont triées en fonction de cette clé avoir une avoir une entrée pour 8192 lignes ça te permet en fait de de récupérer ce qu’on va appeler une granule et auras juste à anniser analyser cet ensemble de granulle qu’on va pouvoir récupérer très rapidement donc ici je vais pouvoir choisir mon donc ma clé de tri donc je vais choisir par exemple en général on veut on veut prendre quelque chose sur lequel on va envoyer des queries de de manière assez récurrente donc avec une faible carteité par exemple item ID donc par exemple si je veux faire de l’analytique sur comment est-ce que se vendent certains de mes certains de mes produits ça va être une bonne clé à utiliser puisquelle sera souvent présente dans mes queries donc je vais choisir celle-là et ensuite je vais vérifier que toutes mes colonnes sont bien sont bien construites donc je vais avoir une colonne adresse item ID order ID et je vois que order time par exemple a été mappé en tant que in 64 mais je vais choisir un date time puisque c’est en fait un de Time jeis choisir de Time et je vais pouvoir ensuite finir finaliser la la construction de ma table je vais donner des permissions à mon à mon service euh kaavka je vais compléter mon mon setup et donc il va il va provisionner du coup euh ce consumer et va pouvoir commencer à à consommer du coup les les les données de mon de mon service de mon de mon topic Kafka donc ça va prendre quelques minutes pour déployer donc c’est ces consumur euh en attendant on peut commencer à à regarder au niveau de euh B ça ça ça c’est déjà fait donc on aura même pas le temps donc on a juste à regarder maintenant on peut vérifier que les données sont bien stockées donc je vais aller dans ma console SQL et on va pouvoir commencer à faire des queries donc je vais pouvoir faire une query qui va s’appeler euh on va faire un un un count vérifier le nombre de données qu’on a dans notre dans notre table hop donc on a 13371 événements qui ont été ont été stockés dans clickhous on peut éventuellement regarder à quoi ressemblent les différents événements donc là je vais on va voir que bon on en a on a pas mal on a l’item 1 qui a l’air d’être assez fréquemment présent et on va pouvoir éventuellement construire nos query SQL donc là je vais faire une petite query très rapid B donc on veut par exemple compter le nombre de de d’items qui ont été vendus euh et on va les grouper par item donc je vais faire un select count item id et on va faire on va sélectionner de ma table simpample data et on va faire un group by on va faire un group by item ID et order byy count [Musique] peut-être j’ai oublié le groupe ici ok parfait donc maintenant on peut voir que bah item les les items 8 9 4 5 sont très présents éventuellement on veut voir à quoi ça ressemble sur un graphique on peut cliquer sur chart ici on va pouvoir mettre je veux avoir mon item ID sur mon axe des X et avoir mon count éventuellement sur mon axe des Y et donc on peut voir ici qu’on a certaines distribution on va pouvoir limiter à on va dire 20 pour voir seulement les 20 plus gros produits qui se vendent donc on voit que c’est les on a une grosse un gros gap entre l’item 2 par exemple et l’item 89 donc ça on a pu le Crès rapidement on va pouvoir éventuellement ensuite faire un un pouvoir rajouter d’autres d’autres informations à notre query he on peut faire un su de euh order unit par exemple euh j’aioubl la virgule éventuellement on va pouvoir ajouter sur le graphe donc dans l’X des Y et là on va avir aussi ce ce ce ce graphe qui va être euh généré donc là en fait ça ça cette outil de visualisation donc c’est pas c’est pas très avancé mais ça nous permet de faire de la l’exploration et éventuellement maintenant ce que je vais faire c’est que je va m’intégrer avec mes mes outils de de de visualisation que que mon équipe utilise de manière récurrente donc on a j’ai configuré mon excuse-mi mvin je t’interrou juste donc là en fait cette partie console SQL ça ressemble beaucoup à ce qu’on a dans bquery snowflake c’est-à-dire tu peux parcourir tes tables tu vois un peu comment elles sont structurées tu peux faire des requêtes dessus voir tes résultats et en gros ça être bien pour pour l’analyse pour quand tu veux un peu explorer tes tes dataset avant de faire des cas d’usage plus industriel quoi c’est ça c’est ça c’est vraiment pour pour pour faire les l’exploration plutôt que de faire des des choses très avancées euh si vous voulez faire des choses très avancées ensuite on supporte enfin bien sûr le but d’une base de données c’est de s’intégrer avec un maximum d’outils externes donc on va s’intégrer très euh très bien avec du grafana avec du supet et cetera donc là par exemple pour grafana on va pouvoir éventuellement créer des visualisations on va pouvoir choisir notre dat source que que j’ai configuré auparavant on va pouvoir mettre notre query donc je récupérer la query j’ai créer auparavant ici hop et on va PIR la mettre ici donc vous pouvez utiliser le query Builder ou alors vous pouvez créer votre propre propre query vous pouvez créer votre propre quer on pouir l’exécuter et éventuellement on va pouvoir choisir la la BAR charts ici on va avoir notre notre visualisation on va pouvoir ajouter ça à notre dashboard et ça c’est l’outil que toute mon équipe par exemple d’analy mes data analyst vont utiliser pour générer leur le leur graphique et leur dashboard pour surveiller les les ventes en temps réel OK et donc là tu parlais de ouis de grafana Super 7 est-ce que sur de la BI plus traditionnel genre tableau clic power bi il y a des connecteurs est-ce que ça fonctionne on se connecte avec tableau pour bi aussi donc on a on a une équipe spécialisée à click houseouse qui va soccuper de maintenir ses ses différentes intégrations avec avec les outils de BI et de visualisation que que que les gens utilisent ok super donc voilà donc c’était une petite démo pour vous montrer comment est-ce qu’on peutah P pliner des données vers clickhouse et ensuite éventuellement les les visualiser dans dans dans grafana génial et j’ai une petite question [Musique] euh est-ce que enfin je pose la question parce que justement l’un des trucs que que met en avant les fournisseurs cloud globaux tu vois c’est par exemple une intégration à leur machine learning typiquement euh est-ce que quand quand tu as des cas d’usage de machine learning que tu veux faire sur ta ta donnée comment est-ce que ça se passe donc en fait on va avoir on va avoir je dirais au niveau du des scénarios machine learning data science dans clickhous principalement on va voir deux scénarios le premier ça va être les gens qui vont faire du vecteur search c’est un scénario qui est déjà supporté par tios donc aujourd’hui on a on supporte du coup un dat type qui s’appelle les vector donc où les gens en fait vont pouvoir insérer des vecteur directement dans COS appliquer des fonctions de distance et cetera et récupérer des vecteurs en fonction d’ d’une d’une d’une distance en particulière on a aussi des indexes euh donc les indexes anoil euh pour pouvoir justement faire des des des des des recherches approximatives mais qui sont beaucoup plus rapides euh donc on a on a ces ces deux supports euh donc ça c’est pour les les gens vraiment qui vont travailler sur des scénarios vecteurs où ils vont déjà faire tout ce qui est embedding euh du côté applicatif stocker les embeddings dans clickh et ensuite faire la la de la la la la du matching de de de de vecteur à en temps réelle avec leckhous et on va avoir des des gros acteurs qui vont nous utiliser de type open eye va nous utiliser pour euh pour pour faire de la si entendu parler de cette compagnie c’est c’est qui V nous utiliser justement pour ce scénario exact où fait ils vont stocker plein de vecteurs des des millions de vecteurs en BD et ensuite ils vont faire de la la comparaison de de vecteur avec avec un index donc il vont faire un to dans un no Meetup je crois dans dans une semaine je crois une de semaines à San Francisco donc si ça vous intéresse regardez notre notre page et ils vont faire un talk about comment sur comment est-ce qu’ils vont comment ils utilisent clickh pour faire du vecteur search le deuxième scénario qu’on va vraiment voir avec avec clickhouse c’est des gens qui vont utiliser clickhouse en tant que feature store donc typiquement on va voir beaucoup de de compagnies dans qui ont faire de de qui vont pousser des des publicités euh en fonction de certaines dimensions de l’utilisateur donc en fait ils vont stocker plein de features dans dans clickhous et en fait ils vont avoir ils vont utiliser clickous pour faire du online et du offline machine learning job donc ils vont avoir le leur job qui vont qui vont utiliser toutes les features qu’s vont avoir il pour récupérer extrêmement rapidement et construire ensuite le leur leur leurs leurs algorithmes sur les features qui sont stockés dans clickhous donc c’est vraiment les les deux les deux cas d’utilisation qu’on voit très fréquemment quand quand on parle de machine learning et data sence a click house ok ça marche euh et comment vous maintenez en par parallèle ou enfin la partie Cloud et la partie Open Source je pas d’un point de vue organisation technique et tout c’est la même chose pas la même chose c’est assez compliqué c’est en partie le travail que j’essaie de faire je suis product manager donc de la partie clickh Open Source en sachant qu’on a aussi donc cette distribution clickh Open Source est en fait on a on a pour simplifier l’hoire on a deux distributions on a une partie open source et une partie qui n’est pas Open Source qu’on va utiliser dans notre cloud mais la partie qui est pas open source et en fait un en gros une branche de notre partie Open Source donc en fait le notre notre but c’est vraiment de maintenir les deux en terme de compatibilité donc les deux sont sont interchangeables mais la partie non Open Source va vraiment être euh conçu pour fonctionner nativement dans le Cloud donc par exemple avoir des tabelles qui sont particuliers comme le CH mat qui vont qui qui sont qui sont conçus pour euh pour avoir la séparation du compulé du storage nativement donc ça nous permet de stocker les données dans du dans du S3 ou dans du Google cloud storage ou dans du Azure blop storage et ensuite avoir des des ns compute qui vont seulement stocker les métadonnées et et pouvoir dynamiquement ajouter supprimer scaler horizontalement verticalement donc donc voilà donc c’est c’est c’est il y a il y a toutes ces ces toutes ces toutes ces additions qu’on doit faire dans la partie cloud euh qu’on fait dans un repository privé et la majorité enfin la majorité des futures de notre de not cloud vienent de l’Open Source ok ça marche euh j’aurais d’autres questions là-dessus mais du coup ça me fait quand même une bonne transition un peu sur sur toi bah ton ton job mais peut-être d’abord ton parcours un peu n raconte comment comment tu es arrivé là euh qu’est-ce que tu as fait avant et tout qu’est-ce que tasé che c’est assz intéressant parce que si tu m’avais posé la question il y a 10 ans je pense pas que je pense pas que je t’aurais dit que j’aurais fini Product Manager pour une pour une boîte tech initialement je voulais faire de la je voulais faire de la la finance mathématique financière euh donc mes études vraiment j’ai fait un une école d’ingénieur spécialisée en en en ma info euh une fois que j’ai eu mon diplôme d’ingénieur j’ai voulu améliorer mes mes mes compétences de je dirais en programmation et du coup j’ai fait une test de Master à l’étranger j’ai fait partie un an et demi à Taiwan où j’ai fait une test de Master en computer science et une fois que j’ai eu mon j’ pendant mes différents stages j’avais beaucoup travaillé avec éastic search euh et du coup bah pendant ma thèse j’avais fait j’avais continué à utiliser laastic search j’ pas mal de d’articles de blog et du coup quand j’ai eu mon diplôme vous m’avez proposé j’ai été contacté par une société qui s’appelle elastic qui a développé la stack bah la stack elk elastic search kibana euh et donc qui m contacter pour savoir si j’étais intéressé pour travailler avec eux donc ils avaient plusieurs plusieurs rôles qui me proposaient ils avaient un rôle de consultant ou alors un rôle de de traineur donc pour enseigner elastic search aux entreprises ou des utilisateurs euh et donc j’ai j’ai passé les entretiens j’ai vraiment et j’ai vraiment en fait aimé la culture de l’entreprise euh en parallèle je faisais toujours des des entretiens avec des des institutions financières JP Morgan Goldman sax et euh j’ai vraiment eu un un meilleur un un meilleur contact humain avec les gens d’élastique etlastique c’est vraiment une société qui est qui est très très très humaine euh et donc j’ai été charmé par par par par la culture la culture d’entreprise la motivation qu’avaient les gens et du coup je me suis dit plutôt que de partir en finance je vais partir dans dans la tech et donc j’ai commencé à à voyager et et à à devenir expert sur la STAC olk à du coup à faire des missions de consulting avec avec des clients un peu partout dans le monde donc j’ai travaillé sur sur pas mal de scénarios beaucoup avec Orange à l’époque euh donc pour pour pour pour apprendre au gens à comment utiliser la siarch et donc je suis resté à laass search 4 ans à la fin à la fin de mon temps on a fait une IPO entre-temps et après ces 4 ans j’étais techlead de toute la partie observabilité dans dans l’équipe service à à à à élastique don j’ai une bonne connaissance du du monde de l’observabilité euh et et j’avais j’avais lu un un article de blog de uber qui parlait de comment est-ce qu’ils avaient fait une migration de elastic search vers clickhous et et du TCO qu’ils avaient qu’ils avaient économisé et céit la première fois qu’en fait que que j’entendais parler de euh de click et j’étais assez surpris de voir que une boîte comme uber utilisait une technologie que j’avais rarement entendu parler donc j’ai commencé à regarder un peu dans qu’est-ce que c’était click house euh je l’ai un peu testé avec des différents différents scénarios et j’ai vu en fait j’ai vraiment étais euh extrêmement surpris par l’efficacité euh de de click House pour toute la partie analytique de le le le la faible coût opérationneli moi qui venais deastic search en fait je voyais le le le TCO d’astic search en fait est très cher vu qu’il y a toute une vivm à maintenir et cetera la la la la mémoire est est très coûteuse avec avec elastic search et du coup au fur à mesure bah que que j’ai testé cette nouvelle technologie qui était nouvelle pour moi mais pas vraiment nouvelle à l’époque bah j’ai vraiment été charmé et du coup j’ai décidé de rejoindre clickhous en en 2021 euh et j’ai j’ai rejoint clickhous initialement en tant que euh worldwide support services manager donc j’étais le le je gérais toute l’équipe support de de click houseous donc initialement j’étais tout seul mais j’ai j’ai recouté une équipe maintenant je pense l’équipe doit être à peu près de de 15 personnes euh donc on a créé une équipe pour aider à à supporter nos clients on pareil on a créé une offre cloud et euh et en fait vu que je travaillais énormément avec les clients et que j’avais beaucoup de retours sur le produit euh et qu’on avait beaucoup de difficultés à recruter un Product Manager pour pour la partie clickhous il faut être l’équipe clickh l’équipe qui développe click est extrêmement technique et souvent le problème des produs managers c’est qu’ il y a pas forcément un niveau de technicité qui qui est très élevé et donc il il demandait un productager qui soit extrêmement technique mais qui soit aussi extrêmement impliqué avec avec les clients et donc on avait beaucoup de mal à trouver le le bon Product Manager pour pour pour ce rôle euh et du coup on m’a demandé bah tu réponds à tous ces critères est-ce que ça t’intéressait de de rejoindre l’équipe produit et d’aider à et d’aider à de définir la la road map pour clickh et travailler avec l’équipe ingéerie les ingénieurs enfin l’équipe engineering les ingénieurs qui qui développent les chaos j’ai dit pourquoi pas j’ai jamais fait de de rôle de product manager à l’époque donc c’est c’est vraiment une une nouveauté ça fait maintenant je pense 8 mois que j’ai pris ces fonctions euh et donc euh maintenant je suis principal product manager de de de click house score et euh donc euh je travaille énormément avec l’équipe engineering euh qui est basé principalement à Amsterdam euh pour essayer de de de définir la roadmap remonter les les difficultés que les les que les clients ont avec notre produit euh trouver les painpint et éventuellement les les trouver comment est-ce qu’on peut les les les améliorer au fur et à mesure du temps donc c’est c’est c’est là où je passe la majorité de mon temps maintenant OK juste tu as parlé de TCO he c’est total cost of ownership c’est ça c’est ça ouais c’est ça c’est en fait le coût opérationnel incluant bah du coup l’infrastructure la la maintenance opérationnelle le nombre de personnes qui doivent être déployé pour pour une une technologie en particulier et cetera ouais alors du coup je vais revenir sur élastique parce que c’est une boîte assez inspirante parce qu’en fait ils ont toujours beaucoup communiqué sur le remote déjà moi c’éit une des premières grosses boîes te que j’ai vu faire du full remote communiquer là-dessus énormément et tout euh moi c’est vrai qu’à une époque je baais sur des moteurs de recherche et donc j’étais un peu en contact avec eux et j’ai toujours été hyper étonné de la vitesse à laquelle les gens répondaient tu vois tuas envoyis un un Linkin à quelqu’un de chez élastique tu avait une réponse dans l’heure en général toujours assez assez surprenant et puis la boîte ouais voilà ils ont tout tout une communication autour autour de ça autour de la culture d’entreprise et tout en dans la réalité c’était comment comment ça se passait le travail ce queô tu es distribué qu’est-ce que tu as tu as appris de ça et tout je dirais en fait moi je je fais partie d’une génération qui est assez particulière je dirais parce que j’ai jamais travaillé en fait dans une entreprise qui n’était pas remote donc donc et la STI était ma première entreprise et quand j’ai rejoint en fait ils m’ont dit dans quel pays tu veux être localisé et donc initialement je devais être quand quand j’ai rejoint élastique initialement je devais être en en APG donc qui est Asia Pacific Japan donc je devais euh être spécialisé dans cette zone géographique hein vu que j’étais à à initialement à Taiwan euh donc j’ai pu choisir en fait le pays en appg euh dans lequel je voulais être localisé j’ai choisi Hong Kong euh euh puis ensuite initi c’est donc le temps qu’il fasse tous mes papiers pour que je puisse être Hong Kong ils m’ont fait un contrat en France euh donc initialement j’ai j’ai commencé de la France mais en parallèle il préparit ma relocation vers vers Hong Kong c’est ce que j’allais dire tu as des contrats locaux à chaque fois enfin il sont de faire des contrats locaux partout quoi donc ils avaient pas mal d’entité en fait moi quand je suis arrivé à élastique on devait être déjà 700 employés donc il y avait déjà pas mal d’entités dans dans beaucoup de pays euh qui faciliter en fait le le recrutement dans dans dans certains pays et ensuite après il passer par des des des je dirais desats provider pour les les pour étendre en fait les la la la la capacité de recruter dans certains pays euh mais je peux parler après comment on on fait à clickh qui est assez similaire donc il y a un gros overlap entre enfin il y il y a un gros euh je dirais euh on a beaucoup d’employés de C viennent d’élastique non moi-même mais par exemple chi revenu officeer vient aussi d’élastique euh la la la vis président des des ressources humaines vient d’élastiqu euh le la vipi des produits vient aussi de as on a on a on a un gros on a un gros noyau qui vient qui vient d’élastiqueaos euh donc donc voilà donc il recrutait vraiment dans dans n’importe quel dans n’importe quel pays on avait des employés vraiment partout dans le monde à élastique et c’était vraiment la la culture était vraiment autour de c’était vraiment ça faisait partie de la nature de de d’élastique d’être distribué mais l’ASTI avait aussi vraiment cette motivation de ne jamais de ne jamais faire en sorte que tu sois isolé donc il y avait beaucoup d’événements qui étaient organisés à travers à travers l’année euh on avait au moins un compagnie all end euh donc c’est c’est un événement un séminaire d’entreprise donc qui qui se déroulait dans un dans un pays en particulier et tout le monde en fait rejoignait ce ce pays pendant l’espace d’une semaine et c’est les 700 personnes de la boîte du monde entier venaient au même endroit pendant une semaine c’est ça euh donc initialement on est 700 et puis à la fin quand je suis parti on devait être à peu près 2000 2000 200 personnes je crois que le dernier le dernier événement le dernier séminaire qu’on a fait c’était il me semble à Orlando on avait fait un un gros séminaire Orlando et pendant une semaine on était on était tout entreprise à à Orlando donc c’était c’était vraiment ça ça per en fait ça permet de créer une une dynamique une dynamique de de groupe qui est assez intéressante puisque pendant cette semaine là euh c’était pas juste des des événements euh d’entreprise c’est euh c’est où on fait la fête et cetera c’est vraiment il y a énormément de travail qui qui qui doit être qui doit être fait donc souvent on va avoir les deux premiers jours des événements qu’on va appeler de euh des euh global session donc c’est avec des sessions pour toute l’entreprise donc où on va pas parler par exemple parler de la stratégie de l’entreprise donc on va avoir l’équipe produit qui va expliquer ok comment est-ce qu’on veut comment est-ce qu’on veut avancer le le produit on va avoir un résumé des des différents différents la go to market stratégie qui va qui va être faite par l’équipe sales et par les les par les les les les les dirigeants de l’entreprise donc ça ça être à peu près les les quelques premiers jours ensuite on va avoir des Breakout session donc des des sessions par équipe donc on va se diviser en équipe avec un agenda qui a été au préalablement fait par par par chacune des équipes avec des présentations qui vont être fait par différents membres le but c’est vraiment de définir des des des actions à prendre en fait pour chaque qu’une des sessions qu’on a en fait c’est une session doit mener à une décision en fait donc on a vraiment on est vraiment arrivrivé sur sur sur toutes ces décisions et euh ensuite on a les les deux derniers jours qui étaient réservés pour pour l’ingineering donc c’était en fait les ingénieurs qui développer les des les produits qui en faisait faisaent des des sessions de Deep dive donc en fait ils allaient faire une présentation par exemple sur une nouvelle fonctionnalité qui développe et donc en fait on va c’est ça ça permettait en fait au au précells ou au ou à l’équipe de de les consultants les trainurs de de de de participer en fait à à ces sessions et vraiment d’apprendre en profondeur comment fonctionne une fonctionnalité et donc là on apprenait vraiment des des choses qui était euh qui était très euh très euh très récente ou alors très très euh très pointu sur le le le le le domaine de de connaissance de la personne qui faisait la à la présentation c’était vraiment super en terme de de d’événement et ensuite bien sûr on a à la fin souvent on avait un jour qui était un Sunday donc c’était des activités qui étaient organisées par l’entreprise on pouvait tous enregistrer à différentes activités mais c’est des semaines de travail à la fin quand tu reviens d’un compagnie tu es tu es fatigué c’est sûr c’est c’est très fatiguant et donc à click house on a vraiment la la même la même culture d’entreprise donc on essaie de pour l’instant nos compagnie en line on essaie Deen faire au moins un par an en sachant que euh il y en a on fait aussi des des all end par Team souvent donc par exemple va avoir l’équipe intégration qui va se réunir et en tant que produit donc moi je suis amené à à me déplacer dans dans plusieurs plusieurs de ces euh euh de ces séminaires euh donc on a vraiment la la même la même mentalité de tout se réunir euh et de de temps en temps de de parler la le prochain compagnie online qu’on fait va être à Singapour en en en il me semble Singapour en en octobre donc ce entreprise va se réunir là-bas et on va pouvoir parler pendant une semaine de de toute la stratégie d’entreprise et donc au niveau des des contrats du coup clickhous lui fait des contrats donc on a des entités dans plusieurs pays mais que dans quelques pays je crois qu’on a les Pays-Bas et les États-Unis et ensuite pour toute la partie opérationnelle donc recruter par exemple les gens en France là point actuellement je suis basé à Barcelone euh donc euh il on passe par un un fournisseur qui s’appelle deal en fait il va pouvoir recruter des employés et en fait les mettre à disposition d’une entreprise euh donc en fait mon employé n’est pas directement clickhous et deal mais deal me met à disposition de de clickhouse le temps qu’on qu’on grossisse une région euh et une fois que la région est assez grosse en général on va la répaner par une entité pour se dégager de de Deal OK et par rapport à la question de l’isolement donc il y a le all end une une semaine par an tu disais et le reste du temps euh plus un peu plus peut-être au quotidien au sein de la semaine comment vous faites en sorte que justement les gens aient l’impression d’appartenir à une équipe ou euh euh on a on a toutes les deux semaines on a compagnie h land donc on fait mais virtuellement donc où en fait on va avoir un résumé de de tout ce que fait toutes les différentes équipes euh donc par exemple on va voir un résumé de ce que fait le board euh enfin de des dernières réunions du board par exemple qui qui se fait de manière trimestrielle euh on va avoir un résumé du produit résumé de l’engineering donc ça c’est ça va être disponible à tout le monde donc on a ACC à ce ce gros événement toutes les de semaines et puis c’est une session de 2 he en général compag de 2 he qui dure pendant qui se fait toutes les de semaines et puis ensuite on a au moins un weekly team meeting donc c’est plus plus je dirais plus plus petite plus petite audience au niveau de l’équipe donc pour mon équipe par exemple c’est tout l’équipe produit où on ser rencontre tous les vendredi soirs pour parler des pour parler des décisions produits euh et des différents problèmes qu’on a rencontré pendant la semaine euh et ensuite pour tout ce qui est l’équipe leadership on a un autre grosse réunion qui est le lundi le lundi soir donc le lundi matin pour les États-Unis donc qui dure 2hur aussi et qui est vraiment plus je dirais plus euh potilleux sur les détails quoi c’est vraiment la la décision de du go to market les les on va parler des clients les les clients chauds donc les clients sur lesquels on doit on doit travailler activement et cetera donc ou les gros logos qu’on a en train d’essayer d’acquérir en ce moment donc les différents blockurs qu’on a ok et en terme d’outil nous par exemple tu vois on a donc on est en remote on a on utilise un outil qui s’appelle gazer c’est une sorte de bureau virtuel on utilise slack pour évidemment pour la communication on utilise beaucoup un outil que tu dois connaître qui s’appelle notion on va mettre toute notre documentation plus la gestion de projet on fait ça là-dedans euh vous qu’est-ce que c’est quoi un vos vos suitees d’outils euh pour bosser comme ça est-ce que déjà le la synchron est très développé j’imagine que oui donc nous on on utilise énormément slack euh on utilise énormément slack euh je veux dire je pense que on doit envoyer des tous des ouais SLAC c’est vraiment le la base beaucoup de Jits aussi on va utiliser beaucoup de gemit extcessivement euh chaque équipe en général a ce qu’on appelle un always on channel donc c’est un c’est un gémite qui est toujours euh allumé donc les gens peuvent peuvent le rejoindre et avoir l’impression d’être au bureau quoi euh donc ça c’est c’est des choses que j’avais mis en place par exemple dans l’équipe support donc euh quelque chose quand tu veux travailler h tu peux aller sur ton wone et tu travailles devant ton devant ton ordinateur et d’autres personnes peuvent te rejoindre et ensuite vous pouvez échanger s’il y a besoin d’échanger euh donc euh il y a ça qu’on utilise pour toute la partie euh euh documentation enfin on va utiliser on va utiliser euh gthub principalement donc ou bien par ou bien le wiki gitub utiliser euh mais voà on général les décisions sont enfin les les les gros sujets sont toujours discutés sur slack et souvent on va au moins le mettre sur un sujet de meeting avant de prendre une décision sur les les grosses décisions donc c’est quelque chose qu’on va toujours parler de manière synchrone avant de de de d’acter une une décision qui est assez importante et sinon on a aussi beaucoup de beaucoup d’autonomie donc pour les décisions qui sont beaucoup moins importantes on n’ pas forcément besoin de de grosse formalité mais qu’ on va avoir une grosse décision à faire on essaie toujours d’avoir au moins au moins de le mettre en item de de d’un d’un team meeting OK et eu si on parle un peu juste vite fait de la road map produit al pas enfin roAp détaillée je pense qu’on connaîit pas assez bien le produit pour ça nous parle mais en gros les les gros gros sujets euh tu vois un peu macro sur lesquel vous bossez donc click c’est vraiment la performance qu’on recherche donc c’est vraiment une une zone qu’on essaie d’améliorer en permanence donc c’est on essaie toujours de d’améliorer les performances de clickh donc il y a un gros item qui s’appelle performance un deuxième item c’est toujours de rendre click encore plus serless donc par exemple là sur un sujet sur lequel on travaille c’est les les les statess worker donc en fait c’est des c’est des nœuds qui qui qui n’ont pas besoin d’appartenir au cluster en fait pour pouvoir exécuter par exemple des queries ou des ou des opérations de background ou des éparation par exemple typiquement clickhous la manière dont il fonctionne c’est que tu vas insérer des données qui vont être triées en fonction de de ta clé de tri mais de temps en temps du coup pour pour garantir en fait un un pour limiter le nombre de fichiers qui sont sur ton file système il va falloir qu’en fait toutes tes toutes tes données que tu as écrit tu les réécrives dans des plus gros fichiers et cetera de temps en temps euh et donc ça c’est des opérations qui s’appellent les merch actuellement elles sont faites par les nœuds de ton cluster donc quand c’est c’est une opération qui prend qui consomme du CPU du coup et qui consomme de la mémoire pour faire pour faireage idéalement on aimerait pouvoir faire toutes ces opérations par des nœuds qui soient en dehors de ton cluster et du coup qui impacte pas les ressources qui sont utilisées par ton cluster et en fait que toutes tes ressources qui sont utilisées par ton cluster soit alloué à tes à tes utilisateurs plutôt que de faire des opérations background et du coup en fait c’est c’est une problématique sur laquelle on travaille donc essayer de pouvoir faire en sorte que des que des toutes ces opérations P fa par par et aussi éventuellement l’exécution de query dans le futur tu pe envoyer une query àck en fait pas exécuté par ton cluster mais peut être exécuté par worker qui réside en dehors de ton cluster et en fait tu payes seulement pour la ressource que query utilisé OK donc ça c’est je dirais de deux items et un un autre projet sur lequel on travaille extensivement c’est bring bring cloud aussi donc on a beaucoup de clients qui veulent qui veulent avoir leurs données dans le dans leur dans leur cloud par exemple leur propres ressources par exemple parce que je sais pas parce qu’ils ont un deal avec AWS qui leur donne des des des des ns de compute qui sont extrêmement peu chers ou du storage qui extrêmement peu cher donc qui veulent éventuellement passer par leur propre euh que que leur donné résid dans leur propre VPC et cetera donc c’est une solution sur laquelle on sur laquelle on est en train de travailler en ce moment ok h et si on parle un peu enfin l’entreprise en elle-même vous êtes combien aujourd’hui et comment c’est réparti entre on va dire tech produit sales et Relation Clients enfin les grands grands les grandes briques quoi euh donc en fait donc l’équipe Sales est vraiment je dirais très présente puisque le but c’est on est vraiment on est vraiment euh on entreprise on a de on a deux fonctions c’est la fonction principale de clickh c’est vendre de clickh de base donc en fait quelqu’un dans click peut avoir que de fonctions ou bien il aide à vendre ou bien il aide à développer un produit qui va qui va se qui va se faire vendre par par clickh donc c’est c’est les les deux fonctions qu’on a dans dans clickh et en fait les la la manière dont on va travailler avec les cell c’est que les cell sont extrêmement présents dans dans nos réunion produit euh mais aussi euh on va souvent souligner les les ce qu’on aime bien faire c’est par exemple les les problèmes que nos clients ont donc on va par exemple avoir souvent on essaie on va essayer par exemple de faire trimestriellement des sessions qui vont être les les 10 barrières d’adoption de click par exemple on va demander à l’équipe on va demander à l’équipe sales à l’équipe support à l’équipe les prcells aussi ok quels sont pour vous les les les les les 10 barrières que vous rencontrez qui vous qui vous qui vous permettent enfin qui qui ralentissent votre cycle de vente de clickh donc on va regarder ensuite c’est ces barrières on va essayer de d’aligner notre map par rapport à ces barrières euh certains certains de ces de ces limitations qui sont qui qui seront rurfacés par par par par ces par cette liste prennent plus de temps à être résolu d’autres peuvent être résolu assez rapidement mais c’est vraiment ça qui va driver un peu notre notre rad map c’est vraiment les les les limitations de les limitations que que que vont nous refaire surfacer l’équipe 16 et l’équipe fi OK et le support du coup c’est inclus dans la fonction de vente quoi de ce que j’entends ouais donc en fait le le support est très quand j’ai quand j’ai créé cette équipe de de support on était vraiment en assistance avec à l’équipe sales donc en fait par exemple on participit au au POC donc proof of concept on aidait à faire les proof of concept d’un client qui voulait migrer vers ck house euh et on est aussi très impliqué dans le le cycle de post sales aussi donc une fois qu’on a vendu on on reste dans le même environnement avec l’équipe support qui qui continue à supporter à à à à garder le client content en fait OK et le modèle économique il inclut enfin vous vandz du service et du logiciel ou que du logiciel et le service le le service on considère que le service est gratuit et do être gratuit pour tous nos utilisateurs euh et du coup en fait on on va juste vendre on va juste vendre le le le le service cloud donc on va on va fournir notre service cloud euh et les gens en fait vont pouvoir juste utiliser le Cloud et s’ils ont des questions il ils vont avoir accès au support et en fait au moment la la la la au moment de la qualification de la solution par le client en fait on va l’accompagner avec par exemple les sales les presses aussi donc il onont pouvoir faire des des POC et l’équipe support sera là aussi en assistance des de du du de l’équipe presses OK et c’est quoi le point le point d’entrée en terme de prix de la solution Cloud grand de grandeur donc on a on a deux dimensions pour le pricing donc c’est c’est quelque chose que je peux montrer assez facilement euh je vais partager mon écran donc en fait on a on a deux on a deux dimensions pour le pressing on a le premère c’est euh le compute et la deuxième c’est le storage donc en fait on va voir la la la mémoire et le CPU utilisé par les instances et ensuite la deuxème c’est du coup le le le le volume de données qui va être stocké sur euh sur S3 donc par exemple ici je vais prendre un exemple euh on va prendre un un service de production qui va tourner sur du AWS on va pouvoir choisir éventuellement la la zone Irlande euh et ensuite on va pouvoir dire le volume de données donc par exemple si je mets 5 5 ta compressés euh donc on va pouvoir voir qu’on va payer 235 dollars par mois pour ce storage et ensuite on va avoir le compute donc le compute lui va être calculé en fonction donc c’est le le temps euh le temps où les ns de compute qui sont auudessus du storage sont allumés donc ici par exemple on va définir qu’s seront allumés à peu près 8h par jour donc qui correspond à peu près à si si par exemple quelqu’un fait de la utilise clickhous pour faire de l’analyse de données pendant la période de de pendant la période de de dirait de pendant sa période de travail au bureau donc c’est à peu près 8h donc ça serait à peu près du coup 364 pour une instance qui fait qui fait 48 Go de mémoire donc 48 Go de mémoire ça sera divisé par 3 pour avoir une grosse disponibilité de une haute disponibilité du service puisqu’on va avoir trois compute nodees qui sont toujours associés à un service euh et uellement donc on a aussi le minimum ici qui est 24 Go donc savoir que clickard va pouvoir en fonction de l’utilisation de la mémoire et du CPU augmenter le nombre de compute dans ces dans ces deux de bordnes on va dire donc si par exemple vous fait beaucoup de query consomme beaucoup de mémoire du coup on va on va monter la mémoire du service pour pouvoir répondre au query ok AZ donc en gros j’imagine vous avez des clients qui vont être à 500 ou 1000 dollars par mois et puis après bon je pense ça peut monter beaucoup si tu as des très gros volumes quoi ouais c’est ça donc ensuite par exemple typiquement là où on va voir les use cases d’observabilité par exemple ça sera des use cases qui sont 24 24 heures donc où il y a pas pas d’ling par exemple où les gens vont peut-être avoir besoin de beaucoup de de compute donc euh le fait qu’il y a pas d’ling ça va forcément augmenter un peu le les les coûts euh mais oui donc on va avoir euh ce qu’on appelle des des clients donc qui vont dépenser plus et ensuite on va avoir des clients qui sont un peu avec des plus petits des plus petites charges de travail pour les clients qui vont dépenser plus on va on va on va fournir des ce qu’on appelle des commit de spend donc c’est les les gens vont pouvoir vendre vous pourir acheter des crédit pour le Cloud euh en amont donc par exemple ils vont dire on ve on va dépenser 200000 dollars par exemple cette cette année dans dans le Cloud on aimerait bien acheter pour 200000 dollars de de crédit et du coup on va pouvoir leur leur leur vendre du coup 200000 dollars en donc plutôt que qu’ils a à mettre leur carte de crédit et soit et soit chargé tous les mois en fait donc ça sera ça la principale différence entre je dirais les clients qui qui qui qui dépensent beaucoup et ensuite les client qui dépense un peu moins ok euh et sinon si on vient sur un peu les ENF l’économie un peu d’entreprise bah tu me disais en Amon vous avez levé pas mal pas mal d’argent qu’est-ce que ça c’est quoi l’impact du coup au quotidien euh pour vous pour les les gens qui bossent dans l’entreprise en quoi ça vous ça vous concerne ou ça vous ça vous touche les les donc tu pardon tu peux répéter la question de la levée de fond c’est enfin tu me disais vous avez levé pas mal d’argent et du coup c’est quoi l’impact en fait pour vous bah en fait pour nous quand a quandon a créé l’entreprise du coup en fait on avait un modèle open source et en fait on avait juste une une distribution Open Source euh qui était euh qui était euh qui était qui était gratuite donc coup les gens juste téléchargent donc pour créer une entreprise où où on a besoin de de recruter par exemple bah pour pour les gens qui développai cl y avait à près 25 personnes euh euh comment est-ce qu’on recrute 25 personnes qu’on a zéro revenu donc il fallait forcément monter monter des des fonds donc on quand on a créé l’entreprise en 2021 on a commencé par bah par chercher des du capital pour pouvoir créer cette entreprise et on a commencé par faire une série A donc qui a été levé qui a été qui a été faite à 50 millions de dollars euh et ensuite on a fait on a enchaîné avec une série B qui nous a permis de relever 250 millions de dollars donc pour une valuation par une pour une valuation d’entreprise à à 2 milliards donc en fait parce que bah comment est-ce qu’on a pu faire cette levée de fond c’est qu’on avait déjà cckh qui était qui était très populaire à l’époque présent de très grand comptes donc on avait uber Netflix euh on a par exemple CRIP qui utilise je sais pas si vous connaissez tri trip.com qui utilise clickhous qui Store qui stock 50 pabits de données je suis allé en Chine récemment où j’ai travaillé avec ce compte il stock 50 pabit de donné en fait on a une déjà une grosse adoption qui est là maintenant c’est comment est-ce qu’on arrive à convertir cette adoption d’un modèle qui soit open source sans support vers un modèle qui soit cloud avec du support et donc c’est ça qui a motivé les investisseurs à à à donner cette à nous aider à lever cette somme d’argent en fait avec cette C avec ces fonds on a pu bien sûr recruter euh bah une équipe hein donc au moin quand j’ai rejoué on était é une vingtaine maintenant on est on est on est plus de plus de 200 euh on a fait ça à peu près en 2 ans donc et puis on commence à à tous les mois tous les mois maintenant on a c’est beaucoup de nouveaux clients avec des une croissance qui est qui est qui est très qui est très importante pour une entreprise de cette de cette taille en fait c’est cette cette cette levée de fond vraiment permet d’accélérer en fait la vitesse de de croissance du du du de l’entreprise ok super intéressant et c’est qui les les investisseurs typiquement c’est des des gros fonds connu ou c’est on a principalement on a benchmark benchmark capital et index venture donc qui sont de de gros de gros WC américains euh donc c’est c’est les c’est ceux qui ont fait la la la l’investissement initial dans dans click donc qui ont aidé à la à qui ont aidé à à faire la la levée de fond en Série A et ensuite après en Série B on a eu d’autres d’autres d’autres VC qui s’appelle ultimat red point light speed light speed qui est qui est un WC qui vient de élastique qui était qui était produ à élastique avant donc il a créé son son propre son propre fond d’investissement et investit dans click OK génial hyper intéressant et je reviens sur l’Open Source juste euh du coup pendant toutes ces années il a quelqu’un qui a développé un truc open source sans zéro revenus il faisent ça à côté enfin je sais pas c’est les gens ça vraiment à côté de le ça faisait partie d’une entreprise en fait c’est nement en fait un un produit qui a été développé pour un backend euh un backend compétiteur à du coup à goleal et du coup c’était développé ensuite en interne ensuite après l’entreprise a décidé d’opensourcer le projet parce que bah il voulait bénéficier de la la l’attraction de l’Open Source éventuellement créer ensuite un Service Manager a-dessus de de ce produitl et en fait ils ont pas eu le temps et du coup quand on a voulu créer une entreprise autour de de ce produit là ils ont décidé de de de d’accepter le du coup qu’on qu’on qu’on qu’on fasse un spinoff de de de ce produit ok intéressant c’est quoi comme entreprise St index d’accord ok ok intéressant donc c’est pour ça que voulais faire un produit compétiteur à à Google analytic parce que ils ont index metrica du coup qui ou qui qui a un compétiteur de de de Google analytique OK et l’esprit de l’Open Source on va dire ça reste un truc qui est qui est important pour vous ou finalement c’est l’histoire et maintenant votre sujet c’est vendre du Cloud et puis c’est ça c’est l’essentiel enfin sans jugement en plus hein c’est une vraie question euh non le l’Open Source reste essentiel he vraiment quand quand on publie tous les mois une une tous les ans une road map qui est road map open source où on met clairement ce qu’on va mettre dans le le dans qui sera pas dans l’open source c’est ce qu’on va mettre clairement dans dans l’Open Source donc c’est aujourd’hui on est vraiment dans un dans un état d’esprit où on est on est une entreprise qui est Open Source la majorité nos nos utilisateurs viennent de l’Open Source aussi donc c’est aussi un un vecteur un vecteur de de je dirais de de commerce pour nous he puisque si on avait pas cette Open Source notre adoption serait bien moindre et du coup les les gens le produit serait bien moins populaire on aurait pas pu faire cette levée de fond donc vraiment l’open source est fondamental pour notre business model ok top euh moi j’ai fait un peu le tour des questions que que j’avais là est-ce que il y a des sujets P qu’on a pas adressé ou d’autres choses que tu voudrais dire pour conclure euh j’ai pas de pas de sujet qui je pense qu’on a fait un gros tour d’horizon un gros tour d’horizon je pense que si peut-être parler un peu plus de on peut parler éventuellement un peu plus de de certains certains cas d’application de de de clickh donc je vous ai dit initialement vraiment euh développé pour faire des des charges analytiques hein mais on divise ça en différentes charges de travail donc on va avoir différentes verticales pour les charges d’analytiqu par exemple on va avoir tout ce qui est marketing et sales par exemple on va avoir des compagnies comme post postog stasig qui vont utiliser clickhous ou alors IB test une entreprise française qui va utiliser clickh on va vraiment avoir aussi une dimension e-commerce où on va avoir Inditex l’entreprise initex qui est propriétaire de Zara par exemple qui va utiler click pour pour monitorer par exemple tout ce qui est l’inventaire et cetera on va voir eBay Walmart adevinta donc qui est le groupe au-dessus de le le bon coin on va avoir tout ce qui est observabilité donc on on en a parlé rapidement donc avec Netflix par exemple on va aussi avoir beaucoup d’entreprises qui vont développer leur propre qui vont utiliser clickh pour leur backend de leur solution d’observabilité donc on va avoir highlight.io qui qui est un qui une une solution pour du tracing par exemple qui été dévelop qui a été créé par un des anciens fondateurs de docker on va avoir tout ce qui est finance donc où on va être très utilisé bah par les institutions financières comme la Deutch Bank nen qui est une entreprise spécialisé dans l’espace de crypto donc on a on a toutes ces verticales qui sont qui sont ai on en a parlé rapidement donc avec Open ai mais on a aussi Lang chain qui va utiliser click house on a vraiment pas mal de vertical et dans chaque vertical on a vraiment c’est euh des des entreprises leaders qui vraiment euh euh utilisent click house vraiment de manière de manière intense on va dire ok hop il y a beaucoup de français chez Cos à part toi euh en français on a on a quelquesuns euh le le manager de l’équipe support en Europe et français euh on va avoir la la la directrice des ressources humaines qui va être française on va avoir aussi euh le product manager de la partie intégration qui va être frané je crois que je crois que c’est tout et le le on a un sales aussi dans dans en France donc d’accord qu’on a qu’on a recruté assez récemment ok avec qui je Traille beaucoup j’imagine eu ok bah top ben écoute je vraiment je vais te remercier parce que cétit hyper hyper dense intéressant la première partie assez technique après on a plus parlé de la culture d’entreprise et tout mais je trouve ça vraiment génial et euh bah écoute merci beaucoup je va essayie d’exploiter cette vidéo intelligemment et et de de la découper en en petits morceau aussi pour des gens aient envie de la regarder en entier donc voilà vraiment merci beaucoup merci à toi de de m’avoir donné la parole et et bonne fin de journée ciao à bientôt Ciao