ความแปรปรวนร่วม vs สหสัมพันธ์: [ทุกสิ่งที่คุณจำเป็นต้องรู้]

เผยแพร่แล้ว: 2021-11-05

จำเป็นต้องมีการเรียงสับเปลี่ยนและการรวมกันจำนวนมากในขณะที่ตีความข้อมูลโดยใช้เทคโนโลยี เช่น การเรียนรู้ของเครื่องและปัญญาประดิษฐ์ ช่วยทำนายผลลัพธ์ที่แตกต่างกันในสถานการณ์ต่างๆ พีชคณิตและชุดค่าผสมเหล่านี้ทำได้อย่างกว้างขวางโดยใช้ตัวแปร

ตัวแปรคือรายการ ปริมาณ หรือตัวเลขที่สามารถวัดได้ในชุดข้อมูล รายการหรือปริมาณนี้ไม่ได้รับการแก้ไขและสามารถเปลี่ยนแปลงได้ในสถานการณ์ที่แตกต่างกันผ่านปัจจัยภายในหรือภายนอก เมื่อใดก็ตามที่ไม่ทราบค่าที่แน่นอนขององค์ประกอบ เราจะเรียกค่านั้นเป็นตัวแปร ดังนั้น ตัวแปรจึงมักถูกอ้างถึงเป็นตัวยึดตำแหน่งของปริมาณที่ไม่รู้จัก ตัวแปรถูกกำหนดให้เป็นค่าที่เปลี่ยนแปลงได้ซึ่งขึ้นอยู่กับคำสั่งหรืออินพุตของโปรแกรมคอมพิวเตอร์ในภาษาคอมพิวเตอร์และภาษาโปรแกรม

ตัวอย่างเช่น ในชุดข้อมูลอีคอมเมิร์ซที่ประกอบด้วยการซื้อของลูกค้า การตั้งค่าของลูกค้า หรือแนวโน้มที่จะสั่งซื้อผลิตภัณฑ์เฉพาะในอนาคตเป็นตัวแปร ขึ้นอยู่กับความต้องการของลูกค้า รายได้ อายุ และปัจจัยอื่นๆ ให้เราเรียนรู้เพิ่มเติมเกี่ยวกับวิธีการทำงานของตัวแปรและวิธีกำหนดความสัมพันธ์ระหว่างตัวแปรสองตัว

สารบัญ

ความแปรปรวนร่วมคืออะไร?

ความแปรปรวนร่วมวัดความสัมพันธ์หรือการพึ่งพาซึ่งกันและกันระหว่างสองตัวแปร เป็นตัวกำหนดทิศทางที่ตัวแปรจะเคลื่อนที่หากตัวแปรอื่นเปลี่ยนชุดข้อมูลเดียวกัน

ความแปรปรวนร่วมเป็นสองประเภท – บวกและลบ เมื่อตัวแปรหนึ่งเปลี่ยนแปลงและตัวแปรที่สองเคลื่อนที่ไปในทิศทางเดียวกัน จะเรียกว่าความแปรปรวนร่วมเชิงบวก หากตัวแปรที่สองเคลื่อนที่ไปในทิศทางตรงกันข้าม จะเรียกว่าความแปรปรวนร่วมเชิงลบ

ค่าความแปรปรวนร่วมที่สูงขึ้นหมายถึงการพึ่งพาของตัวแปรทั้งสอง ความแปรปรวนร่วมทางบวกหมายความว่าตัวแปรเป็นสัดส่วนโดยตรงและจะเคลื่อนที่ไปในทิศทางเดียวกัน ค่าความแปรปรวนร่วมเชิงลบบอกเราว่าตัวแปรสุ่มสองตัวมีความสัมพันธ์ทางอ้อมและเคลื่อนที่ไปในทิศทางตรงกันข้าม หมายความว่าถ้าปริมาณของตัวแปรหนึ่งเพิ่มขึ้น ปริมาณของตัวแปรอื่นจะลดลง

ความสัมพันธ์คืออะไร?

สามารถมีได้มากกว่าหนึ่งตัวแปรในสถานการณ์หรือชุดข้อมูลที่กำหนด ตัวแปรเหล่านี้อาจเกี่ยวข้องทั้งหมดหรือไม่เกี่ยวข้องกัน การหาความสัมพันธ์ระหว่างสองตัวแปรเพื่อรักษาความถูกต้องเป็นสิ่งสำคัญในขณะที่หาผลลัพธ์ที่น่าพอใจ สิ่งนี้เรียกว่าสหสัมพันธ์ (correlation) ซึ่งเป็นการวัดทางสถิติที่แสดงถึงความสัมพันธ์ระหว่างสองตัวแปร

ความสัมพันธ์อธิบายความสัมพันธ์เชิงเส้นตรงระหว่างสองตัวแปรและแสดงการเคลื่อนไหวของตัวแปรหนึ่งเมื่อตัวแปรอื่นเปลี่ยนแปลง

หากมีตัวแปร X และ Y และมีการเปลี่ยนแปลงใน X ความสัมพันธ์จะวัดการเปลี่ยนแปลงใน Y เนื่องจากความแปรผันใน X โดยจะคำนวณว่า Y จะแสดงการเปลี่ยนแปลงเชิงบวกหรือการเปลี่ยนแปลงเชิงลบโดยมีการเปลี่ยนแปลงใน X .

คล้ายกับความแปรปรวนร่วม มีสหสัมพันธ์สามประเภท – บวก ลบ และศูนย์ ในความสัมพันธ์เชิงบวก เมื่อตัวแปรหนึ่งขึ้นไปบนกราฟ ตัวแปรอีกตัวหนึ่งก็จะสูงขึ้นด้วย ในความสัมพันธ์เชิงลบ ถ้าตัวแปรหนึ่งเพิ่มขึ้น ตัวแปรอื่นจะลดลง ในความสัมพันธ์เชิงบวกและเชิงลบ ตัวแปรขึ้นและลงตามสัดส่วนหรือเชิงเส้น หากสหสัมพันธ์เป็นศูนย์ แสดงว่าตัวแปรนั้นไม่สัมพันธ์กัน และไม่มีกราฟเชิงเส้น

วัดความสัมพันธ์โดยใช้สัมประสิทธิ์เพียร์สัน ค่าสัมประสิทธิ์สหสัมพันธ์อยู่ระหว่าง -1 ถึง 1

อะไรคือความแตกต่างระหว่างความแปรปรวนร่วมและสหสัมพันธ์?

คำว่าความแปรปรวนร่วมและสหสัมพันธ์มักใช้สลับกันได้ อย่างไรก็ตามพวกเขาไม่เหมือนกัน เป็นเรื่องยากสำหรับคนที่จะเข้าใจความแตกต่างระหว่างคนทั้งสอง ให้เราเข้าใจในรายละเอียดความแปรปรวนร่วมและสหสัมพันธ์

1. มันวัดอะไร

ความแปรปรวนร่วมและความสัมพันธ์มีความคล้ายคลึงและสับสนมาก ทั้งสองเป็นการวัดตัวแปร อย่างไรก็ตาม ความแตกต่างที่โดดเด่นระหว่างทั้งสองคือความแปรปรวนร่วมจะวัดการเปลี่ยนแปลงระหว่างตัวแปร มันบอกว่าตัวแปรสองตัวมีความสัมพันธ์กันอย่างไรและเคลื่อนที่ไปในทิศทางเดียวกันหรือตรงกันข้ามหรือไม่ ความแปรปรวนร่วมไม่ได้กำหนดว่าตัวแปรเปลี่ยนแปลงอย่างไร เพียงแต่เป็นการยืนยันว่าตัวแปรเกี่ยวข้องกันหรือไม่

ในทางกลับกัน ขอบเขตหรือระดับของการเปลี่ยนแปลงของตัวแปรถูกกำหนดโดยใช้สหสัมพันธ์ มันเป็นหน้าที่ของความแปรปรวนร่วม

2. ค่านิยม

ค่าของความสัมพันธ์มีช่วงระหว่าง -1 ถึง 1 ในทางกลับกัน ค่าความแปรปรวนร่วมสามารถเป็นตัวเลขใดๆ ก็ได้ ค่าของมันอยู่ระหว่างพลังลบและพลังบวกของอนันต์ ความสัมพันธ์มีค่ามาตรฐานในขณะที่ความสำคัญของความแปรปรวนร่วมไม่ชัดเจน เราสามารถหาค่าสหสัมพันธ์ได้ถ้าเรารู้ค่าสัมประสิทธิ์ความแปรปรวนร่วม

3. เปลี่ยนมาตราส่วน

หมายความว่าผลลัพธ์จะเปลี่ยนไปเมื่อตัวแปรถูกคูณด้วยค่าคงที่ การเปลี่ยนแปลงของมาตราส่วนไม่ส่งผลต่อค่าสหสัมพันธ์ แม้ว่าตัวแปรจะถูกคูณด้วยค่าคงที่ สหสัมพันธ์จะยังคงเหมือนเดิม อย่างไรก็ตาม นี่ไม่ใช่กรณีของความแปรปรวนร่วม ได้รับผลกระทบจากการเปลี่ยนแปลงของขนาด หากตัวแปรคูณกับค่าคงที่ ความแปรปรวนร่วมจะเปลี่ยนไปตามนั้น

การใช้ความแปรปรวนร่วมและสหสัมพันธ์ในการเรียนรู้ของเครื่องคืออะไร

มีตัวแปรต่างๆ ในการเรียนรู้ของเครื่อง – ตัวแปรเป้าหมาย อิสระ ปานกลาง สับสน และควบคุม ตัวแปรเหล่านี้ทำหน้าที่ต่างกันและมีบทบาทสำคัญในอัลกอริธึมและเทคนิค ML งานหลักของตัวแปรคือการเพิ่มค่าที่ขาดหายไปในอัลกอริทึม เนื่องจากข้อมูลไม่พร้อมใช้งานในรูปแบบที่มีโครงสร้างเสมอไป อาจมีองค์ประกอบที่ขาดหายไป อัลกอริทึมไม่สามารถทำงานกับข้อมูลที่ไม่สมบูรณ์ได้ ดังนั้นวิศวกรซอฟต์แวร์หรือนักพัฒนาจึงใช้ตัวแปรในการเรียนรู้ของเครื่องเพื่อเติมค่าที่ขาดหายไป

โอกาสในการทำงานของ Machine Learning คืออะไร?

องค์ประกอบที่สำคัญอย่างหนึ่งของการเรียนรู้ของเครื่องและเทคโนโลยี AI คือการพึ่งพาตัวแปรหรือความสัมพันธ์ระหว่างตัวแปรสุ่มสองตัว อัลกอริธึม ML และ AI ให้ผลลัพธ์โดยการระบุความสัมพันธ์ระหว่างสองตัวแปร ดังนั้น ถ้าคุณต้องการสร้างอาชีพในการเรียนรู้ของเครื่อง คุณต้องรู้แนวคิดเกี่ยวกับความแปรปรวนร่วมและสหสัมพันธ์

หากต้องการเรียนรู้เชิงลึกเกี่ยวกับแมชชีนเลิร์นนิงและ AI คุณสามารถลงทะเบียนเรียนใน หลักสูตรวิทยาศาสตรมหาบัณฑิตสาขาวิชาแมชชีนเลิร์นนิงและ AI โดย upGrad

หลักสูตรนี้เป็นหลักสูตรออนไลน์สำหรับวิศวกร ไอที และผู้เชี่ยวชาญด้านข้อมูลที่ช่วยให้พวกเขาได้เรียนรู้เกี่ยวกับแมชชีนเลิร์นนิงและความรู้ด้าน AI โปรแกรมนี้ยังให้สถานะศิษย์เก่าของ Liverpool John Moores University และ International Institute of Information Technology, Bangalore แก่ผู้เรียน

หลักสูตรนี้ให้คุณติดต่อกับผู้เชี่ยวชาญในอุตสาหกรรมจาก Flipkart และ Zee5 คุณยังได้รับโอกาสในการดำเนินการโครงการอุตสาหกรรมมากมายเพื่อรับทักษะที่เกี่ยวข้อง เช่น การเรียนรู้เชิงลึกและการวิเคราะห์เชิงคาดการณ์ และสถิติ

นี่คือโอกาสทางอาชีพที่ดีที่สุดสองประการในการเรียนรู้ของเครื่องและ AI:

1. นักวิทยาศาสตร์ข้อมูล

ในปี 2012 Harvard Business Review ระบุว่า Data Scientist เป็นงานที่เซ็กซี่ที่สุดในศตวรรษที่ 21 เนื่องจากความต้องการนักวิทยาศาสตร์ด้านข้อมูลเติบโตขึ้นอย่างมาก ทุกวันนี้ยังขาดแคลนนักวิทยาศาสตร์ข้อมูลในหลายภาคส่วน หากคุณพบว่าข้อมูลน่าสนใจ แสดงว่าคุณมีงานที่มีรายได้สูงในอุดมคติรอคุณอยู่ เงินเดือน เฉลี่ยของนักวิทยาศาสตร์ด้านข้อมูล ในอินเดียอยู่ที่เกือบ₹เจ็ดแสนต่อปี ผู้เชี่ยวชาญด้านข้อมูลซึ่งมีความเชี่ยวชาญหลายปีสามารถสร้างรายได้สูงถึง ₹17 แสนต่อปี

2. สถาปนิก AI

อีกหนึ่งงานที่สร้างกระแสในวงการนี้คือ AI Architect เช่นเดียวกับสถาปนิกที่ให้บริการโซลูชั่นแก่ลูกค้า AI Architects ยังเสนอโซลูชั่น AI ให้กับลูกค้าอีกด้วย พวกเขาเข้าใจความต้องการของลูกค้าและแนะนำเทคโนโลยีที่เหมาะสม เงินเดือน เฉลี่ยของสถาปนิก AI คือ₹หกแสนต่อปี

เรียนรู้ หลักสูตรออนไลน์วิทยาศาสตร์ข้อมูล จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว

บทสรุป

ตัวแปรมีบทบาทสำคัญในการวิเคราะห์ข้อมูลและการตัดสินใจในการเรียนรู้ของเครื่องและปัญญาประดิษฐ์ ความสัมพันธ์และความแปรปรวนร่วมช่วยในการระบุว่ามีความสัมพันธ์ระหว่างสองตัวแปรหรือไม่ จากนั้นบริษัทต่างๆ สามารถทำนายผลลัพธ์ที่ต้องการและตัดสินใจได้ตามนั้น เป็นแนวคิดที่ซับซ้อนแต่สำคัญที่สุดอย่างหนึ่งของการเรียนรู้ด้วยเครื่อง หากต้องการรับความรู้จากผู้เชี่ยวชาญเกี่ยวกับ Machine Learning และ AI คุณสามารถติดตามโปรแกรม upGrad เกี่ยวกับ ML และ AI

ความแปรปรวนร่วมและความสัมพันธ์เป็นสิ่งเดียวกันหรือไม่?

ไม่ ความแปรปรวนร่วมและความสัมพันธ์ไม่ใช่แนวคิดเดียวกัน แม้ว่าจะมีความสัมพันธ์กันอย่างใกล้ชิด ความแปรปรวนร่วมกำหนดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสุ่มสองตัว และสหสัมพันธ์จะวัดระดับความสัมพันธ์ระหว่างตัวแปรทั้งสอง

ความแปรปรวนร่วมและสหสัมพันธ์เกี่ยวข้องในการเรียนรู้ของเครื่องหรือไม่

ใช่ ความแปรปรวนร่วมและสหสัมพันธ์มีความสำคัญในการเรียนรู้ของเครื่อง เนื่องจากอัลกอริทึม ML จะตีความความสัมพันธ์ระหว่างตัวแปรและส่งมอบผลลัพธ์ตามนั้น ดังนั้น คุณต้องเรียนรู้เกี่ยวกับความแปรปรวนร่วมและสหสัมพันธ์

ทักษะใดบ้างที่จำเป็นสำหรับการประกอบอาชีพด้าน Machine Learning และ AI

ในการรักษาความปลอดภัยงานในอุตสาหกรรม ML หรือ AI คุณควรเชี่ยวชาญในการวิเคราะห์ข้อมูล ความน่าจะเป็นและสถิติ การเขียนโปรแกรมคอมพิวเตอร์ การพัฒนาซอฟต์แวร์ การถดถอยเชิงเส้น การประมวลผลสัญญาณ การประมวลผลภาษาธรรมชาติ และอื่นๆ