Semalt : 언론인을위한 5 가지 멋진 텍스트 긁기 응용 프로그램

기자는 정기적으로 콘텐츠를 수집, 작성 및 배포합니다. 주로 일반 문제, 정치 문제 또는 자연 재해에 중점을 둡니다. 대부분의 언론인은 엔터테인먼트 분야의 뉴스를 다루고 다른 기자들은 게임과 스포츠에 대해 이야기합니다. 기자는 동시에 여러 개의 텍스트 긁기 작업을 수행해야합니다. 데이터를 추출 할뿐만 아니라 정확성과 적법성을 어느 정도 보장합니다. 기자들은 때때로 자신을 위험에 노출시키고 점점 더 많은 독자들을 끌어 들이기 위해 뉴스 기사를 작성합니다. 기자가되고 기본 프로그래밍 기술이 부족한 경우 다음 애플리케이션을 사용하여 작업을 완료 할 수 있습니다.

1. 스크레이퍼 :

Scraper는 가장 유용한 텍스트 및 이미지 스크래핑 서비스 중 하나입니다. 사용하기 쉽고 사용자 친화적 인 인터페이스가 제공됩니다. Scraper를 사용하면 기자는 여러 웹 페이지를 동시에 대상으로 지정하고 전체 또는 부분 사이트에서 데이터를 추출 할 수 있습니다. Scraper는 기계 학습 기술로 가장 잘 알려져 있으며 CNN, BBC 및 기타 유사한 뉴스 웹 사이트에서 일반 텍스트를 추출합니다. 그런 다음이 데이터를 Google 문서, CSV 또는 JSON 파일로 내보낼 수 있습니다. XPath를 사용하여 텍스트 품질을 평가합니다.

2. Outwit Hub :

Outwit Hub는 언론인과 비 프로그래머 모두에게 적합합니다. 이 응용 프로그램을 사용하기 위해 Python, C ++ 또는 Ruby를 배울 필요가 없습니다. 주로 Firefox 확장이며 텍스트 파일, PDF, HTML 문서 및 이미지를 긁습니다. Outwit Hub는 정확한 결과를 제공하며 다양한 웹 사이트를 편리하게 색인화하는 데 사용할 수 있습니다.

3. 스크레이퍼 위키 :

Scraperwiki를 사용하여 Wikipedia 페이지, 온라인 저널, 뉴스 웹 사이트 및 전자 상거래 사이트에서 데이터를 추출 할 수 있습니다. 오류없이 즉시 결과를 제공하는 브라우저 기반 응용 프로그램입니다. 코딩 지식이없는 경우 Scraperwiki가 올바른 옵션입니다. 이 서비스를 통해 기자는 전체 사이트를 긁어 내고 몇 초 만에 데이터를 하드 드라이브에 다운로드 할 수 있습니다. Scraperwiki의 클래식 버전은 앱 개발자, 프리랜서 및 웹 마스터에게 적합합니다.

4. Import.io :

Import.io는 인터넷에서 가장 유용하고 유용한 텍스트 스크랩 서비스 중 하나입니다. 저널리스트는 최신 주제를 검색하고, 데이터를 정확하게 추출하고, 몇 분 안에 자신의 뉴스 웹 사이트에 게시 할 수 있습니다. Import.io를 사용하면 텍스트와 JPG 파일을 모두 긁을 수 있습니다. 설치 및 활성화되면이 도구는 한 번에 최대 2 천 개의 텍스트 스크래핑 프로젝트를 수행합니다. 주어진 URL에서 콘텐츠를 가져 오는 작업이 훌륭하고 문제없이 데이터를 구문 분석 할 수 있습니다.

5. 기모노 랩 :

Import.io와 마찬가지로 Kimono Labs는 많은 사이트를 대상으로합니다. 인터넷에서 본격적인 텍스트 스크레이퍼 및 웹 크롤러 역할을합니다. 정보를 추출하려는 URL을 언급하면 Kimono Labs에서 몇 분 안에 원하는 결과를 얻을 수 있습니다. 머신 러닝 기술로 가장 잘 알려져 있으며 인터넷을 통해 언론인에게 적합한 주제를 찾습니다. 이미지 및 텍스트 파일을 Google 문서 도구에 저장하거나 컴퓨터로 직접 다운로드 할 수 있습니다.

mass gmail