すこぱん
すこぱん
@scopan.bsky.social
小さめの会社でAWSインフラ担当として働いています
Reposted by すこぱん
DuckDBやPolarsのようなシングルノードでも大規模データを簡単に高速に処理できる技術の登場により、分散処理からシングルノード処理へ。コードやMLパイプラインの品質をユニットテストで担保できるように。データエンジニアリングの世界でも技術の螺旋が回っている。

"DWHにSQLでクエリする際にはあまり複雑なロジックを入れず、whereで指定できるフィルタや、ちょっとしたメタデータのjoinに留める"

"集約特徴量などの複雑になりがちな計算はPolarsで書いてユニットテストをちゃんとつける"

テーブルデータの前処理を何でやるか
yng87.page/blog/2025/ho...
テーブルデータの前処理を何でやるか
yng87.page
February 18, 2025 at 6:04 AM
すごい大粒の雪
March 5, 2024 at 2:57 PM
ネコ、すぐ膝に乗ってくるようになったなあ
February 21, 2024 at 9:53 AM
無印だからな…さわりごこち良いよな…
February 18, 2024 at 3:11 PM
猫が布団に脱いだパジャマの上で寝てるから「パパのニオイ好きなのかな〜☺️」とか思ってたけど、さっき出した洗い立てのやつでも寝てるから生地が良いだけだったっぽい
February 18, 2024 at 3:10 PM
printf("Hello, Bluesky.\n");
February 8, 2024 at 2:50 AM