Source: https://github.com/susumuota/arxiv-reddit-summary
Maintained by @ota.bsky.social
アニメのキャラクターは非物理的な動きをすることが多く、一般的な歩行ロボットとはかけ離れたプロポーションをしている。これは、機械設計と様式化されたモーションコントロールの両方における革新のための理想的なプラットフォームを提供します。この論文では、オラフを物理的な世界で生き返らせ、制御のた...
アニメのキャラクターは非物理的な動きをすることが多く、一般的な歩行ロボットとはかけ離れたプロポーションをしている。これは、機械設計と様式化されたモーションコントロールの両方における革新のための理想的なプラットフォームを提供します。この論文では、オラフを物理的な世界で生き返らせ、制御のた...
JWST/NIRSpecによる、z=0.96にある長さ62kpcの線状特徴の先端にある暴走超大質量ブラックホール候補のIFU観測を紹介する。JWSTのデータでは、0.1'' (1 kpc)にわたって約600 km/sの半径方向の速度変化で、先端で鋭い運動学的不連続が見られる。この速度勾配は、予測される衝撃後の流速$approx 300$ km/sととも...
JWST/NIRSpecによる、z=0.96にある長さ62kpcの線状特徴の先端にある暴走超大質量ブラックホール候補のIFU観測を紹介する。JWSTのデータでは、0.1'' (1 kpc)にわたって約600 km/sの半径方向の速度変化で、先端で鋭い運動学的不連続が見られる。この速度勾配は、予測される衝撃後の流速$approx 300$ km/sととも...
具現化AIの進歩は、知的ヒューマノイドロボットの大きな可能性を解き放った。しかし、視覚-言語-動作(VLA)モデルや世界モデルの進歩は、大規模で多様な学習データの不足によって著しく妨げられている。有望な解決策は、ウェブスケールの人間のビデオを「ロボット化」することである。しかし、これらのソリ...
具現化AIの進歩は、知的ヒューマノイドロボットの大きな可能性を解き放った。しかし、視覚-言語-動作(VLA)モデルや世界モデルの進歩は、大規模で多様な学習データの不足によって著しく妨げられている。有望な解決策は、ウェブスケールの人間のビデオを「ロボット化」することである。しかし、これらのソリ...
最近の視覚的生成モデルは、すべての視覚的コンテンツが単一のキャンバスに融合されるラスター画像のもつれた性質のために、画像編集中の一貫性にしばしば苦労する。これとは対照的に、プロのデザイン・ツールはレイヤー表現を採用し、一貫性を保ちながら単独での編集を可能にしている。このことに動機づけら...
最近の視覚的生成モデルは、すべての視覚的コンテンツが単一のキャンバスに融合されるラスター画像のもつれた性質のために、画像編集中の一貫性にしばしば苦労する。これとは対照的に、プロのデザイン・ツールはレイヤー表現を採用し、一貫性を保ちながら単独での編集を可能にしている。このことに動機づけら...
SHARPは、1つの画像からフォトリアリスティックなビューを合成するアプローチである。1枚の写真が与えられると、SHARPは描かれたシーンの3Dガウス表現のパラメータを回帰する。これは、標準的なGPU上で、ニューラルネットワークを介したシングルフィードフォワードパスを介して1秒未満で行われる。SHARPによ...
SHARPは、1つの画像からフォトリアリスティックなビューを合成するアプローチである。1枚の写真が与えられると、SHARPは描かれたシーンの3Dガウス表現のパラメータを回帰する。これは、標準的なGPU上で、ニューラルネットワークを介したシングルフィードフォワードパスを介して1秒未満で行われる。SHARPによ...