Národný bezpečnostný úrad upozorňuje, že jazykový model DeepSeek zbiera od používateľov dáta v oveľa väčšom rozsahu ako konkurencia. Zahŕňajú dokonca presné časovanie stlačení jednotlivých klávesov, zadané pokyny (prompty), heslá, vkladané obrázky, audio súbory, dokumenty, ale aj IP adresu počítača, z ktorého sa služba používa, systémový jazyk a podobne. Informácie sú následne ukladané na servery v Číne. Používatelia nemajú nad dátami kontrolu, ako je zvykom v prípade konkurenčných produktov. Tie špecifikujú, ako dlho sú dáta ukladané a poskytujú funkciu dočasného chatu. Narábanie s údajmi je transparentnejšie.
Na základe porovnania pravidiel ochrany súkromia DeepSeek a OpenAI zbiera čínsky model viac dát než americký OpenAI. Rozdiel je aj v tom, kde sa dáta ukladajú. V Európskej únii, v ktorej OpenAI deklaruje súlad s GDPR, máme robustný systém na ukladanie a ochranu dát pred ich zneužitím. Tento koncept v Číne chýba. Naopak, súkromné dáta sú tam aktívne využívané na účely komunistickej strany (štátu). Problém DeepSeek je podobný tomu, ktorý mala aj aplikácia TikTok – potenciálne zneužitie zbieraných dát. Podmienky používania DeepSeek obsahujú klauzulu o tom, že aplikácia môže využiť dáta na dodržiavanie legálnych nariadení alebo pre dobro verejnosti.
To, že prompty (otázka, príkaz alebo tvrdenie, ktoré vkladáte do AI modelu) sa posielajú priamo, môže viesť k budovaniu profilu osoby, prípadne jeho zamestnania. Údaje o systémoch používateľov, ako typ systému či jazyk, môžu slúžiť aj na kybernetické útoky, kedy sú napríklad známe zraniteľnosti pre určité systémy v určitom nastavení, čo môže uľahčiť útočníkom cestu do systému. Jedným zo spôsobov, ako sa pri využívaní DeepSeek vyhnúť zberu dát, je využívať lokálny, stiahnutý model.