하노이의 온라인 판매점 주인인 민 씨는 이전에 ChatGPT로 이미지를 만들 때 글자 부분이 종종 오차, 글꼴 불일치 또는 읽기 어려웠다고 말했습니다.
배너부터 제품 사진까지 상품 판매를 게시하기 위해 사진을 만들 때마다 글자가 잘못되거나, 글꼴이 잘못되거나, 읽기 어려워서 글자 부분을 거의 전부 수정해야 합니다. 어떤 날은 글자를 수정하는 데만 한 시간이나 걸려서 직접 디자인하는 것보다 시간이 더 오래 걸립니다. 그래서 저는 이 작업에 ChatGPT를 거의 사용하지 않습니다."라고 씨는 말했습니다.
이러한 제한 사항 때문에 Quan 씨와 많은 다른 사용자들은 글자가 있는 사진을 만들 때 Google의 Gemini와 같은 다른 도구로 점차 전환하고 있습니다. 이전의 ChatGPT와 비교했을 때 이 도구의 텍스트 표시 기능은 더 안정적인 것으로 평가됩니다.

그러나 ChatGPT의 이미지 2.0 업데이트 이후 이 경험은 바뀌었습니다. 배너 만들기를 다시 시도했을 때 씨는 결과가 "이전과는 완전히 다릅니다."라고 말했습니다. 베트남어 글자는 명확하게 표시되고, 기호가 정확하며, 너무 많은 수정 없이 즉시 사용할 수 있습니다.
하노이의 그래픽 디자이너인 투 항 씨는 처음에는 알기 위해 다시 시도했지만 결과가 자신을 놀라게 했다고 말했습니다. "인포그래픽을 만들었기 때문에 글자 오류가 매우 두렵습니다. 이전에는 ChatGPT를 거의 사용하지 않았습니다. 너무 많이 수정해야 했기 때문입니다. 이번에 시도해 보니 글자가 대부분 맞았고 구도도 유지할 수 있습니다. 약간만 조정하면 사용할 수 있습니다."라고 항 씨는 말했습니다.
한편, 소셜 미디어 콘텐츠 제작자인 득안 씨도 새로운 이미지 2.0 업데이트를 경험했을 때 놀라움을 금치 못했습니다. "베트남어로 인용한 일련의 사진을 만들려고 했는데 결과가 꽤 괜찮게 표시되어 수정 없이 바로 사용할 수 있습니다."라고 득안 씨는 말했습니다.
OpenAI에 따르면 Images 2. 0은 텍스트, 아이콘 및 복잡한 레이아웃과 같은 작은 세부 사항을 더 잘 처리하도록 개선되었습니다. 모델에는 추론 기능도 통합되어 있어 표시하기 전에 결과를 자체적으로 확인하고 최적화하여 문자와 같은 어려운 구성 요소의 오류를 줄일 수 있습니다.

AI가 텍스트를 정확하게 표시하는 것은 확산 기술의 특성상 큰 과제이며, 일반적으로 작은 세부 사항보다 전체 이미지를 재현하는 것을 우선시합니다. 이로 인해 문자, 특히 베트남어와 같은 도장 언어는 쉽게 왜곡됩니다.
실제 테스트 결과 새 버전은 이 제한 사항을 크게 개선한 것으로 나타났습니다. 긴 텍스트는 많은 경우에 여전히 명확성과 철자를 유지합니다.
그럼에도 불구하고 도구는 여전히 완전히 안정적이지 않습니다. 일부 복잡한 레이아웃 또는 정보가 많은 차트에서도 오류가 발생할 수 있습니다.
베트남어로는 "사용할 가치가 없다"고 여겨졌던 ChatGPT는 점차 사용자 신뢰를 회복하고 있습니다. 정확한 글자 표시 기능은 AI가 실제 응용 프로그램에 진입할 수 있는지 여부를 결정하는 중요한 요소로 간주됩니다.