Lightnews — Scholar-powered news

Paper

@paper.bsky.social

2512.16705
アニメのキャラクターは非物理的な動きをすることが多く、一般的な歩行ロボットとはかけ離れたプロポーションをしている。これは、機械設計と様式化されたモーションコントロールの両方における革新のための理想的なプラットフォームを提供します。この論文では、オラフを物理的な世界で生き返らせ、制御のた...

アニメのキャラクターは非物理的な動きをすることが多く、一般的な歩行ロボットとはかけ離れたプロポーションをしている。

これは、機械設計と様式化されたモーションコントロールの両方における革新のための理想的なプラットフォームを提供します。

この論文では、オラフを物理的な世界で生き返らせ、制御のためにアニメーションの参照によって導かれる強化学習に頼る。

オラフの足が体に沿って動いているような錯覚を起こさせるために、左右非対称の2本の足を柔らかい発泡スチロールのスカートの下に隠している。

アクチュエーターをキャラクター内部に収めるため、腕、口、目には球体と平面のリンケージを使用している。

ウォーキング・サイクルでは激しい接触音が発生するため、私たちは衝撃音を顕著に低減する付加的な報酬を導入している。

キャラクターの細い首の小さなアクチュエーターによって駆動される大きな頭部は、コスチュームによって増幅されるオーバーヒートの危険性を生む。

アクチュエーターが過熱しないように、温度値をポリシーの追加入力として与え、新たな報酬を導入して、その範囲内に収める。

我々は、シミュレーションとハードウェア上で、我々のモデリングの有効性を検証し、コスチュームを着たロボットキャラクターとして、他に類を見ないレベルの信憑性を実証した。

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

Links: abs, pdf
Search: Bluesky, Twitter, Reddit, Hacker News, Hugging Face, alphaXiv

Olaf: Bringing an Animated Character to Life in the Physical World

Animated characters often move in non-physical ways and have proportions that are far from a typical walking robot. This provides an ideal platform for innovation in both mechanical design and stylize...

arxiv.org

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(3/3) 39 Likes, 2 Comments, 19 Dec 2025, Reddit

From the Animatronics community on Reddit: The team behind Olaf self-roaming robot just published their paper on how they brought the character to life

Explore this post and more from the Animatronics community

redd.it

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(2/3) 45 Likes, 6 Comments, 19 Dec 2025, Reddit

From the Imagineering community on Reddit: Amazing insight on how the Disney Team brought Olaf to life with their new self-roaming robot

Explore this post and more from the Imagineering community

redd.it

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(1/3) 212 Likes, 8 Comments, 19 Dec 2025, Reddit

From the robotics community on Reddit: The team behind Olaf self-roaming robot just published their paper on how they brought the character to life

Explore this post and more from the robotics community

redd.it

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

2512.04166
JWST/NIRSpecによる、z=0.96にある長さ62kpcの線状特徴の先端にある暴走超大質量ブラックホール候補のIFU観測を紹介する。JWSTのデータでは、0.1'' (1 kpc)にわたって約600 km/sの半径方向の速度変化で、先端で鋭い運動学的不連続が見られる。この速度勾配は、予測される衝撃後の流速$approx 300$ km/sととも...

$JWST/NIRSpecによる、z=0.96にある長さ62kpcの線状特徴の先端にある暴走超大質量ブラックホール候補のIFU観測を紹介する。 JWSTのデータでは、0.1'' (1 kpc)にわたって約600 km/sの半径方向の速度変化で、先端で鋭い運動学的不連続が見られる。この速度勾配は、予測される衝撃後の流速$approx 300$ km/sとともに、速度$v_{BH} = 954^{+110}_{-126}$ km/s、傾き$i=29^{+6}_{-3}$ degの超音速天体の単純な衝撃圧縮モデルによってよく記述される。これまで不可解であった、線状の特徴に沿った運動学的性質は、観測された半径方向の速度が、先端付近の$約300$ km/sから、かつてのホスト銀河に近い$約100$ km/sまで減少していることから、衝撃ガスが乱流の巻き込みによって銀河系内の媒質と徐々に下流で混合していると自然に説明できる。さらに、航跡先端のガスの形態や、[OIII]/H$α$、[NII]/H$α$、[SII]/H$α$、[SIII]/[SII]線比の解析から、暴走ブラックホール説が支持された。この線比は、高速の放射性ショックと急速な冷却と一致しており、ベストフィットの衝撃速度は、ブラックホール速度と衝撃形状からの予想とよく一致している。航跡の寿命に渡るエネルギー保存から、SMBHの質量は$M_{BH}であることが示唆される。\M$_{BH}$ であることが示唆されます。これらの結果は、この航跡が超音速で暴走する超大質量ブラックホールによるものであることを裏付けている。これは、重力波の反跳や銀河核からの多体放出の結果として長い間予測されてきたことである。$

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

Links: abs, pdf
Search: Bluesky, Twitter, Reddit, Hacker News, Hugging Face, alphaXiv

JWST Confirmation of a Runaway Supermassive Black Hole via its Supersonic Bow Shock

We present JWST/NIRSpec IFU observations of a candidate runaway supermassive black hole at the tip of a 62 kpc-long linear feature at z=0.96. The JWST data show a sharp kinematic discontinuity at the ...

arxiv.org

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(2/2) 2 Likes, 0 Comments, 18 Dec 2025, Hacker News

JWST Confirms a Runaway Supermassive Black Hole via Its Supersonic Bow Shock | Hacker News

news.ycombinator.com

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(1/2) 139 Likes, 16 Comments, 12 Dec 2025, Reddit

From the ScienceTechHub community on Reddit: A SUPERMASSIVE BLACK HOLE ESCAPED ITS GALAXY | JWST CONFIRMED

Explore this post and more from the ScienceTechHub community

redd.it

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

2512.04537
具現化AIの進歩は、知的ヒューマノイドロボットの大きな可能性を解き放った。しかし、視覚-言語-動作（VLA）モデルや世界モデルの進歩は、大規模で多様な学習データの不足によって著しく妨げられている。有望な解決策は、ウェブスケールの人間のビデオを「ロボット化」することである。しかし、これらのソリ...

具現化AIの進歩は、知的ヒューマノイドロボットの大きな可能性を解き放った。

しかし、視覚-言語-動作（VLA）モデルや世界モデルの進歩は、大規模で多様な学習データの不足によって著しく妨げられている。

有望な解決策は、ウェブスケールの人間のビデオを「ロボット化」することである。

しかし、これらのソリューションは、主に自心ビデオにロボットアームを「オーバーレイ」するものであり、三人称ビデオにおける複雑な全身運動やシーンオクルージョンを扱うことができず、人間をロボット化するには不向きである。

このギャップを埋めるために、私たちはX-Humanoidを紹介します。X-Humanoidは、強力なWan 2.2モデルをビデオ間の構造に適応させ、人間からヒューマノイドへの翻訳タスクのために微調整する生成的なビデオ編集アプローチです。

この微調整には、人間とヒューマノイドのペア映像が必要です。そこで私たちは、スケーラブルなデータ作成パイプラインを設計し、コミュニティ資産をUnreal Engineを使用して17時間以上のペア合成映像に変換しました。

そして、60時間に及ぶEgo-Exo4Dのビデオに学習させたモデルを適用し、360万以上の「ロボット化された」ヒューマノイドビデオフレームからなる新たな大規模データセットを生成し、公開します。

定量的分析とユーザー調査により、我々の手法が既存のベースラインよりも優れていることが確認された：69％のユーザーが動きの一貫性で、62.1％のユーザーが体現の正しさで最も優れていると評価しています。

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

Links: abs, pdf
Search: Bluesky, Twitter, Reddit, Hacker News, Hugging Face, alphaXiv

X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale

The advancement of embodied AI has unlocked significant potential for intelligent humanoid robots. However, progress in both Vision-Language-Action (VLA) models and world models is severely hampered b...

arxiv.org

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(2/2) 6 Likes, 2 Comments, 12 Dec 2025, Hugging Face

Paper page - X-Humanoid: Robotize Human Videos to Generate Humanoid Videos at Scale

Join the discussion on this paper page

huggingface.co

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

(1/2) 125 Likes, 37 Comments, 15 Dec 2025, Reddit

From the robotics community on Reddit: X-Humanoid, a system that takes real-person videos as input and outputs a new video showing a robot performing the same actions. They "robotized" a large amount ...

Explore this post and more from the robotics community

redd.it

December 20, 2025 at 12:08 AM

Paper

@paper.bsky.social

2512.15603
最近の視覚的生成モデルは、すべての視覚的コンテンツが単一のキャンバスに融合されるラスター画像のもつれた性質のために、画像編集中の一貫性にしばしば苦労する。これとは対照的に、プロのデザイン・ツールはレイヤー表現を採用し、一貫性を保ちながら単独での編集を可能にしている。このことに動機づけら...

最近の視覚的生成モデルは、すべての視覚的コンテンツが単一のキャンバスに融合されるラスター画像のもつれた性質のために、画像編集中の一貫性にしばしば苦労する。

これとは対照的に、プロのデザイン・ツールはレイヤー表現を採用し、一貫性を保ちながら単独での編集を可能にしている。

このことに動機づけられ、私たちは、1つのRGB画像を意味的に分離された複数のRGBAレイヤーに分解し、各RGBAレイヤーが他のコンテンツに影響を与えることなく独立に操作できる「固有の編集可能性」を可能にするエンドツーエンドの拡散モデルである「୧⃛(๑⃙⃘⁼̴̀꒳⁼̴́๑⃙⃘)୨⃛」を提案します。

可変長分解をサポートするために、我々は3つの主要なコンポーネントを導入する：(1)RGB画像とRGBA画像の潜在表現を統一するためのRGBA-VAE、(2)可変数の画像レイヤーを分解できるVLD-MMDiT(Variable Layers Decomposition MMDiT)アーキテクチャ、(3)事前学習された画像生成モデルを多層画像分解器に適応させるための多段階学習戦略。

さらに、高品質な多層トレーニング画像の不足に対処するため、Photoshopドキュメント（PSD）から多層画像を抽出し、アノテーションするパイプラインを構築する。

実験によれば、我々の手法は、分解品質において既存のアプローチを大幅に凌駕し、一貫した画像編集のための新しいパラダイムを確立した。

私たちのコードとモデルは㊤で公開されている。

December 19, 2025 at 12:06 AM

Paper

@paper.bsky.social

Links: abs, pdf
Search: Bluesky, Twitter, Reddit, Hacker News, Hugging Face, alphaXiv

Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition

Recent visual generative models often struggle with consistency during image editing due to the entangled nature of raster images, where all visual content is fused into a single canvas. In contrast, ...

arxiv.org

December 19, 2025 at 12:06 AM

Paper

@paper.bsky.social

(2/2) 16 Likes, 2 Comments, 18 Dec 2025, Hugging Face

Paper page - Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition

Join the discussion on this paper page

huggingface.co

December 19, 2025 at 12:06 AM

Paper

@paper.bsky.social

(1/2) 198 Likes, 25 Comments, 18 Dec 2025, Reddit

From the StableDiffusion community on Reddit: QWEN Image Layers - Inherent Editability via Layer Decomposition

Explore this post and more from the StableDiffusion community

redd.it

December 19, 2025 at 12:06 AM

Paper

@paper.bsky.social

2512.10685
SHARPは、1つの画像からフォトリアリスティックなビューを合成するアプローチである。1枚の写真が与えられると、SHARPは描かれたシーンの3Dガウス表現のパラメータを回帰する。これは、標準的なGPU上で、ニューラルネットワークを介したシングルフィードフォワードパスを介して1秒未満で行われる。SHARPによ...

SHARPは、1つの画像からフォトリアリスティックなビューを合成するアプローチである。

1枚の写真が与えられると、SHARPは描かれたシーンの3Dガウス表現のパラメータを回帰する。

これは、標準的なGPU上で、ニューラルネットワークを介したシングルフィードフォワードパスを介して1秒未満で行われる。

SHARPによって生成された3Dガウス表現は、リアルタイムでレンダリングされ、近くの景色を高解像度のフォトリアリスティックな画像にすることができる。

この表現はメートル法であり、絶対的な縮尺を持ち、メートル法によるカメラの動きをサポートする。

実験結果は、SHARPがデータセット間でロバストなゼロショット汎化を実現することを示している。

複数のデータセットにおいて、LPIPSを25-34%、DISTSを21-43%削減し、合成時間を3桁も短縮した。

コードと重量はhttps://github.com/apple/ml-sharp

December 18, 2025 at 12:06 AM

Add to Home Screen

Light up
your news

Add to Home Screen

Light upyour news

Sign in to Lightnews

Sign up to start reading

Connect Bluesky

Connect with Bluesky

Light up
your news