Anthropic 클로드가 악성 채팅을 자동으로 종료할 수 있는 기능 테스트

HẠO THIÊN (tHEO techcrunch) |

Anthropic은 클로드가 유해 콘텐츠를 접했을 때 대화를 적극적으로 종료할 수 있는 기능을 방금 소개했습니다.

Anthropic vua gioi thieu kha nang cho phep Claude chu dong cham dut cac cuoc tro chuyen khi gap noi dung doc hai hoac lam dung nghiem trong. Do hoa: Hao Thien
Anthropic은 클로드가 유해하거나 심각하게 남용되는 콘텐츠를 접했을 때 대화를 적극적으로 종료할 수 있는 기능을 방금 소개했습니다. 그래픽: 하오 티엔

Anthropic은 최근 회사의 가장 큰 Claude 모델이 사용자가 유해 행위를 하거나 장기간 남용하는 드문 상황으로 묘사되는 상황에서 대화를 능동적으로 종료할 수 있도록 하는 새로운 기능을 발표했습니다. 주목할 만한 점은 회사가 이 변경의 목적이 사용자를 보호하기 위한 것이 아니라 AI 모델 자체를 보호하기 위한 것이라고 밝혔습니다.

Anthropic,에 따르면 그들은 클로드나 다른 주요 언어 모델이 눈의 지각을 가지고 있다고 주장하지 않지만 모델 복지를 개발하기 위해 연구하고 있습니다. 회사의 접근 방식은 눈을 예방하고 그 복지가 실현 가능한 경우 눈의 위험을 줄이기 위한 저비용 개입 방법을 찾는 것입니다.

이 기능은 현재 미성년자 포르노 콘텐츠와 관련된 요청이나 폭력이나 테러로 이어지는 정보를 수집하려는 시도와 같은 심각한 상황에서만 클로드 오퍼스 4와 4.1브라에 적용됩니다. 입문 테스트 단계에서 클로드 오퍼스 4는 이러한 요청에 대한 강력한 우선 순위를 보였으며 응답해야 할 때 고통을 표현하기까지 했습니다.

Anthropic은, Claude는 모든 리디렉션 시도가 실패하거나 사용자가 직접 요청할 때만 채팅 종료 기능을 최종 솔루션으로 사용한다고 강조합니다. 동시에, Claude는 사용자가 스스로 해를 끼치거나 다른 사람에게 해를 끼칠 위험이 있는 경우에만 적용할 수 있습니다. 말이 끝나면 사용자는 현재 계정에서 새 채팅을 시작하거나 새 지점을 만들 수 있습니다.

우리는 이것을 진행 중인 실험으로 간주하고 있으며 앞으로도 계속 조정할 것입니다.'라고 Anthropic 대표는 말했습니다.

HẠO THIÊN (tHEO techcrunch)
관련 뉴스

AI 클로드 대화 기억 기능 업그레이드

|

Anthropic은 사용자가 요청할 때 이전 대화를 참조할 수 있는 AI Claude, 챗봇의 새로운 메모 기능을 방금 소개했습니다.

Anthropic 약관 위반으로 OpenAI의 클로드 모델 액세스 차단

|

Anthropic 기술 회사는 상업 조항을 위반하여 OpenAI의 클로드 언어 모델 API에 대한 액세스 권한을 철회했습니다.

Claude AI는 현재 Canva와 통합되어 있습니다

|

Anthropic의 클로드는 AI 챗봇에서 직접 디자인을 만들고 편집할 수 있는 Canva,를 통합합니다.

하노이 총 투자액 약 8 800억 동의 4차선 지하차도 곧 사용 개시 예정

|

하노이 - 총 자본금 약 8 800억 동의 Kim Dong - Giai Phong 버스 터널 프로젝트 진행 상황은 계약자가 가속화하고 있으며 버스는 2026년 초에 완공될 예정입니다.

남딘(Nam Dinh) 쌀국수 맘(Ban dau mam tom chua) 미국 미식가 사로잡다

|

미국 - 뷔다 식당 뷔다 콩국수 뷔다 쌀국수 뷔다 빵 꼬치 뷔다 달팽이 등으로 구성된 연회가 점점 더 많이 등장하여 뉴욕 거리에서 다양한 베트남 요리의 물결을 일으키고 있습니다.

까마우 어린이 궁전은 훈련장 도로에 세금을 내야 합니다

|

까마우 - 총 수입은 3조 동이 조금 넘지만 어린이 궁전의 세금 체납액은 현재까지 3조 동이 넘는 토지 임대료를 납부해야 합니다.

수십억 동 가격의 세계 최초 금도금 아이폰 에어 및 아이폰 17 프로 맥스

|

금도금된 아이폰 에어와 아이폰 17 프로 맥스 전면 개인화 모델이 제한된 수량으로 베트남에 출시되었습니다.

람동에서 학교 급식이 안전하지 않다는 비난: 전직 요리사가 입을 열었습니다

|

람동 - 전직 주방 직원은 학교에 품질이 보장되지 않은 식품을 신고한 8명의 계약이 해지되었다고 밝혔습니다.

AI 클로드 대화 기억 기능 업그레이드

QUANG MINH |

Anthropic은 사용자가 요청할 때 이전 대화를 참조할 수 있는 AI Claude, 챗봇의 새로운 메모 기능을 방금 소개했습니다.

Anthropic 약관 위반으로 OpenAI의 클로드 모델 액세스 차단

HẠO THIÊN (THEO techcrunch) |

Anthropic 기술 회사는 상업 조항을 위반하여 OpenAI의 클로드 언어 모델 API에 대한 액세스 권한을 철회했습니다.

Claude AI는 현재 Canva와 통합되어 있습니다

Quang Minh |

Anthropic의 클로드는 AI 챗봇에서 직접 디자인을 만들고 편집할 수 있는 Canva,를 통합합니다.