분류는 주어진 입력 데이터 샘플에 레이블을 할당하는 것과 관련된 예측 모델링 문제입니다. 분류 예측 모델링의 문제는 데이터 샘플이 주어진 클래스 레이블의 조건부 확률을 계산하는 것으로 구성될 수 있습니다. Bayes 정리는 이 조건부 확률을 계산하는 원칙적인 방법을 제공하지만 실제로는 엄청난 수의 샘플(매우 큰 크기의 데이터 세트)이 필요하고 계산 비용이 많이 듭니다. 대신, Bayes 정리의 계산은 각 입력 […]
Bayes 정리는 조건부 확률을 계산하는 원칙적인 방법을 제공합니다. 직관이 종종 실패하는 사건의 조건부 확률을 쉽게 계산하는 데 사용할 수 있지만 믿을 수 없을 정도로 간단한 계산입니다. 확률 분야에서 강력한 도구이지만 Bayes 정리는 머신러닝 분야에서도 널리 사용됩니다. 모델을 훈련 데이터 세트에 맞추기 위한 확률 프레임워크(줄여서 최대 사후 또는 MAP라고 함)에서의 사용과 Bayes 최적 분류기 및 Naive […]
연속 확률 변수에 대한 확률은 연속 확률 분포로 요약할 수 있습니다. 연속 확률 분포는 머신러닝, 특히 모델에 대한 수치 입력 및 출력 변수의 분포와 모델에 의한 오류 분포에서 발생합니다. 정규 연속 확률 분포에 대한 지식은 또한 많은 머신러닝 모델에 의해 수행되는 밀도 및 매개 변수 추정에서보다 일반적으로 요구됩니다. 따라서 연속 확률 분포는 응용 머신러닝에서 중요한 […]
이산 확률 변수에 대한 확률은 이산확률 분포로 요약할 수 있습니다. 이산 확률 분포는 머신러닝, 특히 이진 및 다중 클래스 분류 문제의 모델링 뿐만 아니라 신뢰 구간 계산과 같은 이진 분류 모델의 성능 평가 및 자연어 처리를 위한 텍스트의 단어 분포 모델링에도 사용됩니다. 이산 확률 분포에 대한 지식은 분류 작업을 위한 딥러닝 신경망의 출력 계층에서 활성화 함수를 선택하고 […]
확률은 한 사건의 가능성을 계산하는 것 이상으로 사용될 수 있습니다. 가능한 모든 결과의 가능성을 요약 할 수 있습니다. 확률에는 확률 변수라고 하는 흥미로운 것이 있으며 확률 변수에 대한 각 가능한 결과와 확률 간의 관계를 확률 분포라고합니다. 확률 분포는 확률의 중요한 기본 개념이며 일반적인 확률 분포의 이름과 모양은 익숙할 것입니다. 확률 분포의 구조와 유형은 계량형 또는 이산형과 […]
확률 계산은 직관적이지 않습니다. 우리의 두뇌는 문제를 생각하고 확률을 올바르게 계산하는 대신 지름길을 택하고 잘못된 답을 얻는 데 너무 열심입니다. 응용 확률의 고전적인 문제를 해결하는 것이 문제를 명확하게 하고 직관을 개발하는 데 유용할 수 있습니다. 생일 문제, 남자 또는 여자 문제, 몬티 홀 문제와 같은 이러한 문제는 올바른 해결책에 도달하기 위해 주변 확률, 조건부 확률 […]
단일 확률 변수에 대한 확률은 간단하지만 두 개 이상의 변수를 고려할 때 복잡해질 수 있습니다. 우리는 다음과 같은 확률에 대해 관심을 갖게 될 수 있습니다. 결합 확률 : 두 개의 동시 사건에 대한 확률 조건부 확률 : 다른 사건의 발생을 감안할 때 한 사건의 확률 주변 확률 : 다른 변수에 관계없이 일어나는 사건의 확률 이러한 […]
확률은 확률 변수 결과의 불확실성을 정량화합니다. 단일 변수에 대한 확률을 이해하고 계산하는 것은 비교적 쉽습니다. 그럼에도 불구하고 머신러닝에는 종종 복잡하고 알려지지 않은 방식으로 상호 작용하는 많은 확률 변수가 있습니다. 여러 확률 변수에 대한 확률을 정량화하는 데 사용할 수 있는 특정 기술(예: 결합 확률, 한계 확률 및 조건부 확률)이 있습니다. 이러한 기술은 예측 모델을 데이터에 적용하는 […]
확률에 대한 머신러닝 속성 과정.7일 안에 머신러닝에 사용된 확률을 파악하세요. 확률은 머신러닝의 기반이 되는 수학 분야입니다. 확률은 많은 난해한 이론과 발견이 있는 넓은 분야이지만 머신러닝 실무자에게는 현장에서 가져온 너트와 볼트, 도구 및 기호가 필요합니다. 확률이 무엇인지에 대한 견고한 기초가 있으면 연구에 좋은 부분이나 관련성 있는 부분에만 집중할 수 있습니다. 이 집중 과정에서는 7일 만에 Python을 […]
응용 머신러닝에는 불확실성 관리가 필요합니다. 머신러닝 프로젝트에는 특정 데이터 값의 차이, 도메인에서 수집된 데이터 샘플 및 이러한 데이터에서 개발된 모델의 불완전한 특성을 포함하여 많은 불확실성 원인이 있습니다. 예측 모델링을 위한 머신러닝에 내재된 불확실성 관리는 불확실성을 처리하도록 특별히 설계된 분야인 확률의 도구와 기술을 통해 달성할 수 있습니다. 이 게시물에서는 머신러닝의 불확실성 문제를 발견하게 될 것입니다. 이 […]