데이터 전처리란?
Study/BigData·2023. 4. 11.
데이터 전처리는 데이터 분석의 첫 번째 단계로, 데이터를 수집, 정제 및 변환하여 분석에 적합한 형태로 만드는 과정입니다. 이 단계에서는 데이터의 결측값, 이상값, 중복값 등을 처리하고, 데이터 형식을 일치시키는 등의 작업이 필요합니다. 아래 내용은 chatGPT의 도움을 받아 작성하였습니다. 1) 데이터 수집: 데이터 전처리의 첫 번째 단계는 데이터를 수집하는 것입니다. 데이터는 다양한 소스에서 수집될 수 있으며, 주로 파일, 데이터베이스, 웹사이트, 센서 등에서 수집됩니다. 데이터를 수집할 때는 데이터의 크기, 형식, 속성 등을 고려하여 적절한 방법을 선택해야 합니다. 데이터 수집 방법: 어떤 데이터를 수집할 때 어떤 방식으로 수집하는 것이 적절한지에 대한 문제입니다. 예를 들어, 소셜미디어 데이터를..