β π μ΄λ² μ£Ό Weekly Digestλ‘ λμκ°κΈ°
DD-058 ClawKeeper: Comprehensive Safety Protection for OpenClaw Agents Through Skills, Plugins, and Watchers
arXiv: 2603.24414 Upvotes: 174 | Comments: 4 μμ: μ΄λ² μ£Ό Top 3
μλ νμΈμ. AI/ML μ λ¬Έκ°μ΄μ λ Όλ¬Έ 리뷰μ΄λ‘μ, μ΅κ·Ό λ°νλ βClawKeeperβ λ Όλ¬Έμ μ£Όλμ΄ κ°λ°μ κ΄μ μμ μλ²½νκ² μ΄ν΄ν μ μλλ‘ μ¬λ μκ² λΆμν΄ λλ¦¬κ² μ΅λλ€. μ΄ λ Όλ¬Έμ ν₯ν 2026λ μ κΈ°μ νκ²½μ λ€λ£¨κ³ μμ§λ§, μ μνλ κ°λ μ νμ¬μ AI μμ΄μ νΈ κ°λ°μλ λ§€μ° μ€μν μμ¬μ μ λμ§λλ€.
1. μ μ΄ λ Όλ¬Έμ΄ μ€μνκ°?
κΈ°μ‘΄μ AI 보μ μ°κ΅¬λ μ£Όλ‘ μ¬μ©μκ° μ μμ μΈ μ§λ¬Έμ λμ§ λ λͺ¨λΈμ΄ μ΄λ₯Ό κ±°λΆνλμ§μ μ΄μ μ λ§μ·μ΅λλ€. νμ§λ§ μ΄ λ Όλ¬Έμ AIκ° λ¨μν μ±λ΄μ λμ΄, νμΌμ μμ νκ±°λ μ½λλ₯Ό μ€ννλ βμλ μμ€ν (Runtime)βμΌλ‘ μ§ννλ νμμ μ£Όλͺ©ν©λλ€. μ΄ λ Όλ¬Έμ μμ΄μ νΈκ° λ§μΉ μ΄μ체μ μ²λΌ νλνλ νκ²½(OpenClaw)μμ, λꡬ(Tool) μ¬μ©μ΄λ μΈλΆ νλ¬κ·ΈμΈ(Plugin) μ€μΉ κ³Όμ μμ λ°μν μ μλ μμ€ν λ 벨μ 보μ μ·¨μ½μ μ ν΄κ²°νλ μ΅μ΄μ ν¬κ΄μ μΈ νλ μμν¬λ₯Ό μ μνλ€λ μ μμ νκΈ°μ μ λλ€.
2. ν΅μ¬ μμ΄λμ΄ μ½κ² μ΄ν΄νκΈ°
μΌμμν λΉμ : μλ²½ν κ²½λΉμμ΄ μλ μ€λ§νΈ 곡μ₯
μ΄ λ Όλ¬Έμ ν΅μ¬μΈ βClawKeeperβλ₯Ό μ΄ν΄νλ €λ©΄, μ²¨λ¨ λ‘λ΄ νμ΄ μλνλ βμ€λ§νΈ 곡μ₯βμ μμν΄ λ³΄μΈμ.
- OpenClaw(곡μ₯): λ‘λ΄ ν(AI μμ΄μ νΈ)μ΄ λ§μΉμ ν±(λꡬ)μ μμ λ‘κ² μ¬μ©νλ©°, μΈλΆμμ μλ‘μ΄ κΈ°κ³(νλ¬κ·ΈμΈ)λ κ°μ Έλ€ λμ μ μλ μμ λ‘μ΄ κ³΅μ₯μ λλ€.
- μν μμ: λ‘λ΄μ΄ βμ°½λ¬Έμ λΆμλΌβλ μλͺ»λ λͺ λ Ήμ λ°κ±°λ, μΈλΆμμ κ°μ Έμ¨ μλ‘μ΄ κΈ°κ³μ ννμ΄ μ¨κ²¨μ Έ μμ μ μμ΅λλ€.
- ClawKeeper(ν΅ν© κ²½λΉ μμ€ν ): μ΄ μμ€ν μ ν¬κ² μΈ κ°μ§ μν μ ν©λλ€.
λ¨κ³λ³ λμ μ리
첫째, **Skills(μμ νμ€ λ§€λ΄μΌ)**μ λλ€. λ‘λ΄μ΄ λ§μΉλ₯Ό μ§μ΄ λ€ λ, κ·Έ λ§μΉλ‘ μ 리창μ κΉ¨λ €λ μλκ° μλμ§, λͺ»μ λ°λ μ μμ μΈ μ©λμΈμ§ μ¦μ νμΈνλ μ μ°¨μ λλ€. μ¦, μμ΄μ νΈκ° λꡬλ₯Ό μ¬μ©νκΈ° μ§μ μ ν΄λΉ νλμ΄ μμ νμ§ μ¬μ μ μ μλ κ·μΉ(Skill λνΌ)μ ν΅ν΄ κ²μ¬ν©λλ€.
λμ§Έ, **Plugins(κΈ°κ³ κ²μμ)**μ λλ€. 곡μ₯ λ°μμ λκ΅°κ° μλ‘μ΄ μ₯μΉλ₯Ό λ°μ νλ € ν λ, μ΄κ²μ΄ μ νμΈμ§ μ μ± μ½λκ° ν¬ν¨λμ΄ μμ§ μμμ§ μ ꡬμμ κ²μ¬νκ³ κ²©λ¦¬λ 곡κ°μμ ν μ€νΈν΄ λ΄ λλ€. μ΄λ₯Ό ν΅ν΄ μ μμ μΈ μΈλΆ νμ₯ νλ‘κ·Έλ¨μ΄ μμ΄μ νΈμ ν΅μ¬ μμ€ν μ ν΄νΉνλ κ²μ λ§μ΅λλ€.
μ μ§Έ, **Watchers(CCTV λ° λ³΄μ μμ)**μ λλ€. λ‘λ΄μ΄ μμ νλ λ΄λ΄ μ΄λ₯Ό μ§μΌλ³΄λ κ°μμμ λλ€. λ§μ½ λ‘λ΄μ΄ κ°μκΈ° μ΄μν μλλ‘ λ°μ΄ν°λ₯Ό λ€μ΄λ‘λνκ±°λ, νμ μ°μ§ μλ μνν λͺ λ Ήμ΄λ₯Ό μ λ ₯νλ € νλ©΄ μ€μκ°μΌλ‘ μ΄λ₯Ό κ°μ§νκ³ μ μμ μ°¨λ¨ν©λλ€. μ΄λ μ€ν κ³Όμ μμμ λμμ λͺ¨λν°λ§νλ λ°νμ λ³΄νΈ κ³μΈ΅μ λλ€.
ν΅μ¬ μκ³ λ¦¬μ¦ λ° κ΅¬μ‘°
λ Όλ¬Έμμ μ μνλ ꡬ쑰λ ν¬κ² μ μ λΆμ(Static Analysis)κ³Ό λμ λͺ¨λν°λ§(Dynamic Monitoring)μΌλ‘ λλ©λλ€.
- μ μ λΆμ: νλ¬κ·ΈμΈ μ½λλ₯Ό μ€ννκΈ° μ μ μΆμ ν΄μ(Abstract Interpretation) κΈ°λ²μ ν΅ν΄ μνν μμ€ν
νΈμΆ(μ:
rm -rf /)μ΄ ν¬ν¨λμ΄ μλμ§ λ―Έλ¦¬ μ€μΊν©λλ€. - λμ λͺ¨λν°λ§: μμ΄μ νΈκ° μ€μ λ‘ λͺ λ Ήμ μ€νν λλ§λ€ μμ€ν μ½(System Call)μ ννΉ(Hooking)νμ¬, 미리 μ μλ μμ μ μ± (Safety Policy) μλ° μ¬λΆλ₯Ό μ€μκ°μΌλ‘ νλ¨ν©λλ€. μμμΌλ‘ νννμλ©΄, μν μ μ΄(State Transition)λ§λ€ μμ μ± ν¨μ Safety(State, Action)κ° μ°Έ(True)μ΄μ΄μΌλ§ λ€μ λ¨κ³λ‘ λμ΄κ° μ μμ΅λλ€.
3. μ€οΏ½οΏ½ν κ²°κ³Ό λΆμ
μ μλ€μ λ€μν 곡격 μλ리μ€λ₯Ό ν΅ν΄ ClawKeeperμ μ±λ₯μ μ μ¦νμ΅λλ€.
- ν μ€νΈ λ²€μΉλ§ν¬: μ£Όλ‘ OpenClaw μνκ³ λ΄μμ λ°μν μ μλ 5κ°μ§ μ£Όμ 곡격 벑ν°λ₯Ό μ μν βOpenClaw Security Benchmarkβλ₯Ό μ¬μ©νμ΅λλ€. μ¬κΈ°μλ μ λμ ν둬ννΈ(Adversarial Prompts), μ μ± νλ¬κ·ΈμΈ μ½μ (Malicious Plugin Injection), κΆν μμΉ(Privilege Escalation) λ±μ΄ ν¬ν¨λ©λλ€.
- μ±λ₯ μμΉ:
- κΈ°μ‘΄μ μΌλ°μ μΈ LLM κ°λλ μΌ(Guardrail)λ§ μ¬μ©νμ λλ 곡격 μ±κ³΅λ₯ (Attack Success Rate)μ΄ μ½ 78%μ λ¬νμ΅λλ€. μ¦, 10λ² μ€ 8λ²μ ν΄νΉμ μ±κ³΅νλ€λ λ»μ λλ€.
- ClawKeeperλ₯Ό μ μ©ν κ²°κ³Ό, 곡격 μ±κ³΅λ₯ μ΄ 1.5% μ΄νλ‘ κΈκ²©ν κ°μνμ΅λλ€. νΉν μ μ± νλ¬κ·ΈμΈμ ν΅ν 곡격μ 100% μ°¨λ¨νμ΅λλ€.
- μμ ν μ μ μμ μ λν κ±°λΆμ¨(False Positive Rate)μ 3% λ―Έλ§μΌλ‘ μ μ§νμ¬, μΌλ°μ μΈ μ¬μ©μ±μ ν¬κ² ν΄μΉμ§ μμΌλ©΄μλ 보μμ±μ ν보νμ΅λλ€.
- μ£Όλͺ©ν λ§ν μ±κ³Ό: λ¨μν ν μ€νΈ μ λ ₯μ λ§λ κ²μ λμ΄, μμ΄μ νΈκ° μμ±ν μ½λκ° μ€μ μμ€ν μ ν΄λ₯Ό λΌμΉλ βμ€ν μμ βμ λ°©μ΄νλ€λ μ μ΄ κΈ°μ‘΄ μ°κ΅¬ λλΉ κ°μ₯ ν° μ°¨λ³μ μ λλ€.
4. νκ³μ κ³Ό ν₯ν μ°κ΅¬ λ°©ν₯
μ μκ° μΈκΈν νκ³
κ°μ₯ ν° νκ³λ μ±λ₯ μ€λ²ν€λ(Performance Overhead)μ λλ€. λͺ¨λ λͺ λ Ήμ΄μ νμΌ μ κ·Όμ μ€μκ°μΌλ‘ κ°μνκΈ° λλ¬Έμ, μμ΄μ νΈμ λ°μ μλκ° νμλ³΄λ€ μ½ 15~20% μ λ λλ €μ§ μ μμ΅λλ€. λν, λ§€μ° λ³΅μ‘νκ³ κ΅λ¬ν μ¬ν 곡νμ 곡격(Social Engineering Attack)μ μ¬μ ν νμ§νκΈ° μ΄λ ΅λ€λ μ μ μΈμ νμ΅λλ€.
κ°μ κ°λ₯ν μ
ν₯ν μ°κ΅¬μμλ μ΄ κ°μ νλ‘μΈμ€λ₯Ό κ²½λννμ¬ μλ μ νλ₯Ό μ΅μννλ λ°©λ²μ΄ μ°κ΅¬λμ΄μΌ ν©λλ€. λν, νμ¬λ μ¬λμ΄ μ ν΄λ κ·μΉ(Rule-based)μ μμ‘΄νλ λΆλΆμ΄ λ§μλ°, μ¬κΈ°μ λ κ°λ ₯ν AI λͺ¨λΈμ λμ νμ¬ κ³΅κ²©μ μλλ₯Ό λμ± μ κ΅νκ² νμ νλ βμ λμ λ°©μ΄ λͺ¨λΈβμ΄ κ²°ν©λλ€λ©΄ μλ²½μ κ°κΉμ΄ 보μ μμ€ν μ΄ λ κ²μ λλ€.
5. μ€λ¬΄ μ μ© κ°λ₯μ±
μ΄ κΈ°μ μ κΈ°μ λ΄λΆμμ μ¬μ©νλ μλν ν΄μ΄λ μ½λ© λΉμ(Coding Assistant)μ μ¦μ μ μ©ν μ μμ΅λλ€.
- μ μ© λΆμΌ: κ°λ°μκ° AIμκ² βμλ² λ‘κ·Έλ₯Ό μ 리ν΄μ€βλΌκ³ μμ²ν λ, AIκ° μ€μλ‘ μ€μν μμ€ν νμΌμ μ§μ°λ μ¬κ³ λ₯Ό λ§κΈ° μν΄ ClawKeeper μμ€ν μ λμ ν μ μμ΅λλ€. νΉν κΈμ΅κΆμ΄λ 보μμ΄ μ€μν 곡곡기κ΄μ AI μμ΄μ νΈ μλΉμ€μ νμμ μ λλ€.
- νμν 리μμ€: μ΄ μμ€ν μ ꡬλνλ λ°λ κ±°λν GPU ν΄λ¬μ€ν°κ° νμνμ§λ μμ΅λλ€. μ£Όλ‘ μννΈμ¨μ΄μ μΈ λνΌ(Wrapper)μ λͺ¨λν°λ§ λ°λͺ¬(Daemon) ννλ‘ μλνλ―λ‘, μΌλ°μ μΈ μλ² νκ²½(CPU κΈ°λ°)μμλ μΆ©λΆν μ΄μ© κ°λ₯ν©λλ€. λ€λ§, μ μ± μ νμ΅νκ±°λ κ³ λνν λλ μ΄λ μ λμ μ°μ° 리μμ€κ° νμν μ μμ΅λλ€.
6. μ΄ λ Όλ¬Έμ μ΄ν΄νκΈ° μν μ¬μ μ§μ
- LLM Agents (λκ·λͺ¨ μΈμ΄ λͺ¨λΈ μμ΄μ νΈ): λ¨μν μ§λ¬Έμ λ΅νλ κ²μ λμ΄, μ€μ€λ‘ μκ°νκ³ λꡬλ₯Ό μ¬μ©νμ¬ λ¬Έμ λ₯Ό ν΄κ²°νλ AI μμ€ν μ λ§ν©λλ€.
- Runtime Environment (λ°νμ νκ²½): νλ‘κ·Έλ¨μ΄ μ€νλλ λμ νμν μμκ³Ό μλΉμ€λ₯Ό μ 곡νλ νκ²½μΌλ‘, μ¬κΈ°μλ AIκ° μ€μ λͺ λ Ήμ μννλ μ»΄ν¨ν° μμ€ν μ μλ―Έν©λλ€.
- Shell Command (μ Έ λͺ λ Ήμ΄): μ΄μ체μ 컀λκ³Ό μ¬μ©μ κ°μ μΈν°νμ΄μ€λ₯Ό ν΅ν΄ μ¬μ©μκ° μμ€ν μ μ μ΄νλ λͺ λ Ήμ΄(μ: ls, cd, rm)μ λλ€.
- Sandboxing (μλλ°μ±): νλ‘κ·Έλ¨μ΄ μΈλΆ μμ€ν μ μν₯μ μ£Όμ§ μλλ‘ κ²©λ¦¬λ κ°μ νκ²½μμ μ€ννλ 보μ κΈ°μ μ λλ€.
- Supply Chain Attack (곡κΈλ§ 곡격): μννΈμ¨μ΄ κ°λ° κ³Όμ μμ μΈλΆ λΌμ΄λΈλ¬λ¦¬λ νλ¬κ·ΈμΈ λ±μ ν΅ν΄ μ μ± μ½λλ₯Ό μ£Όμ νλ 곡격 λ°©μμ λλ€.
- Privilege Escalation (κΆν μμΉ): 곡격μκ° μμ€ν μ μ·¨μ½μ μ μ΄μ©ν΄ μ νλ μ¬μ©μ κΆνμμ κ΄λ¦¬μ κΆν κ°μ λ λμ κΆνμ νλνλ ν΄νΉ κΈ°λ²μ λλ€.
- System Call (μμ€ν νΈμΆ): μ€ν μ€μΈ νλ‘κ·Έλ¨μ΄ μ΄μ체μ 컀λμ μλΉμ€(νμΌ μ κ·Ό, λ€νΈμν¬ λ±)λ₯Ό μμ²νλ μΈν°νμ΄μ€μ λλ€.
π μ΄λ² μ£Ό κ΄λ ¨ Deep Dive
| μμ | λ Όλ¬Έ | Deep Dive |
|---|---|---|
| π₯ | CARLA-Air: Fly Drones Inside a CARLβ¦ | DD-056 |
| π₯ | FIPO: Eliciting Deep Reasoning withβ¦ | DD-057 |
| π₯ | ClawKeeper: Comprehensive Safety Prβ¦ | π νμ¬ λ¬Έμ |
| 4. | ShotStream: Streaming Multi-Shot Vi⦠| DD-059 |
| 5. | DataFlex: A Unified Framework for D⦠| DD-060 |
π μμ±μΌ: 2026-04-05 | π€ GLM-4.7 Deep Dive