Over 10 years we help companies reach their financial and branding goals. Engitech is a values-driven technology agency dedicated.

Gallery

Contacts

411 University St, Seattle, USA

engitech@oceanthemes.net

+1 -800-456-478-23

Technology

머신러닝 알고리즘 비교를 위한 통계적 유의성 테스트

머신러닝 방법을 비교하고 최종 모델을 선택하는 것은 적용된 머신러닝의 일반적인 작업입니다. 모델은 일반적으로 평균 기술 점수를 직접 계산하고 비교하는 k-fold 교차 검증과 같은 리샘플링 방법을 사용하여 평가됩니다. 이 접근 방식은 간단하지만 평균 기술 점수 간의 차이가 실제인지 통계적 우연의 결과인지 알기 어렵기 때문에 오해의 소지가 있습니다. 통계적 유의성 검정은 이 문제를 해결하고 동일한 분포에서 추출되었다는 […]

Technology

파이썬에서 파라메트릭 통계적 가설 테스트를 계산하는 방법

모수 통계 방법은 종종 데이터 샘플에 가우스 분포가 있다고 가정하는 방법을 의미합니다. 응용 머신러닝에서는 데이터 샘플, 특히 샘플의 평균을 비교해야 합니다. 아마도 한 기술이 하나 이상의 데이터 세트에서 다른 기술보다 더 잘 수행되는지 확인하기 위해. 이 질문을 정량화하고 결과를 해석하기 위해 스튜던트 t-검정 및 분산 분석과 같은 모수가설 검정 방법을 사용할 수 있습니다. 이 자습서에서는 둘 […]

Technology

파이썬에서 비모수 통계 가설 테스트를 계산하는 방법

응용 머신러닝에서는 두 데이터 샘플의 분포가 동일한지 또는 다른지 확인해야 하는 경우가 많습니다. 표본이 동일한 분포를 가질 가능성을 정량화할 수 있는 통계적 유의성 검정을 사용하여 이 질문에 답할 수 있습니다. 데이터에 익숙한 가우스 분포가 없으면 유의성 검정의 비모수 버전을 사용해야 합니다. 이러한 테스트는 유사한 방식으로 작동하지만 배포가 없으므로 테스트를 수행하기 전에 먼저 실제 값 데이터를 […]

Technology

파이썬의 17가지 통계적 가설 테스트

응용 머신러닝에 필요한 17가지 통계 가설 테스트에 대한 빠른 참조 가이드와 Python의 샘플 코드입니다. 사용할 수 있는 수백 개의 통계적 가설 테스트가 있지만 여기에는 머신러닝 프로젝트에서 사용할 작은 하위 집합만 있습니다. 이 게시물에서는 Python API를 사용하는 예제와 함께 머신러닝 프로젝트에 대한 가장 인기 있는 통계적 가설 테스트에 대한 치트 시트(cheat sheet)를 찾을 수 있습니다. 각 […]

Technology

k-폴드 교차 검증에 대한 짧은 소개

교차 유효성 검사는 머신러닝 모델의 기술을 추정하는 데 사용되는 통계적 방법입니다. 응용 머신러닝에서 주어진 예측 모델링 문제에 대한 모델을 비교하고 선택하는 데 일반적으로 사용되는 이유는 이해하기 쉽고 구현하기 쉬우며 일반적으로 다른 방법보다 편향이 낮은 기술 추정치를 생성하기 때문입니다. 이 자습서에서는 머신러닝 모델의 기술을 추정하기 위한 k-fold 교차 유효성 검사 절차에 대한 간략한 소개를 발견할 수 […]

Technology

Bootstrap method에 대한 짧은 소개

Bootstrap method는  모집단에 대한 통계를 추정하는 데 사용되는 리샘플링 기술로서 대체(replacement)를 사용하여 데이터 세트를 샘플링하는 방식입니다. 이는 평균 또는 표준 편차와 같은 요약 통계량을 추정하는 데 사용할 수 있습니다. 응용 머신러닝에서 학습 데이터에 포함되지 않은 데이터에 대한 예측을 수행할 때 머신러닝 모델의 기술을 추정하는 데 사용됩니다. 머신러닝 모델 기술 추정 결과의 바람직한 속성은 추정된 기술이 교차 검증과 […]

Technology

통계적 샘플링 및 리샘플링에 대한 짧은 소개

데이터는 응용 머신러닝의 통화(currency)입니다. 따라서 효과적으로 수집하고 사용하는 것이 중요합니다. 데이터 샘플링은 모집단 모수를 추정할 목적으로 도메인에서 관측치를 선택하는 통계적 방법을 나타냅니다. 데이터 리샘플링은 수집된 데이터 세트를 경제적으로 사용하여 모집단 매개변수의 추정치를 개선하고 추정의 불확실성을 정량화하는 데 도움이 되는 방법을 말합니다. 데이터 샘플링과 데이터 리샘플링은 모두 예측 모델링 문제에 필요한 방법입니다. 이 자습서에서는 데이터를 수집하고 최대한 활용하기 위한 […]

Technology

정규 요약 통계 계산에 대한 짧은 소개

데이터 샘플은 도메인에서 생성되거나 프로세스에서 생성될 수 있는 모든 가능한 관측치의 광범위한 모집단의 스냅샷입니다. 흥미롭게도 많은 관측치는 정규 분포 또는 더 공식적으로 가우스 분포라고 하는 일반적인 패턴이나 분포에 적합합니다. 가우스 분포에 대해 많이 알려져 있으며, 따라서 가우스 데이터와 함께 사용할 수있는 통계 및 통계 방법의 전체 하위 필드가 있습니다. 이 자습서에서는 가우스 분포, 가우스 분포를 […]

Technology

파이썬에서 변수간의 상관 관계를 계산하는 방법

데이터 세트의 변수 간에 복잡하고 알 수 없는 관계가 있을 수 있습니다. 데이터 세트의 변수가 서로 의존하는 정도를 발견하고 정량화하는 것이 중요합니다. 이 지식은 선형 회귀와 같은 머신러닝 알고리즘의 기대치를 충족하도록 데이터를 더 잘 준비하는 데 도움이 될 수 있으며, 이러한 상호 종속성이 있을 경우 성능이 저하됩니다. 이 자습서에서는 상관 관계가 변수 간의 관계에 대한 통계적 요약이며 […]

Technology

파이썬의 데이터 시각화 방법에 대한 짧은 소개

때로는 차트 및 플롯과 같은 시각적 형태로 볼 수 있을 때까지는 데이터가 의미가 없습니다. 자신과 다른 사람을 위해 데이터 샘플을 빠르게 시각화 할 수 있는 것은 응용 통계와 응용 머신러닝 모두에서 중요한 기술입니다. 이 튜토리얼에서는 Python에서 데이터를 시각화 할 때 알아야 할 5가지 유형의 플롯과 이를 사용하여 자신의 데이터를 더 잘 이해하는 방법을 알아봅니다. 이 […]