Gebruik clusteranalise in Microsoft Excel

Pin
Send
Share
Send

Een van die instrumente om ekonomiese probleme op te los, is groepontleding. Met die hulp daarvan word groepe en ander voorwerpe van die datastelsel in groepe geklassifiseer. Hierdie tegniek kan in Excel toegepas word. Kom ons kyk hoe dit in die praktyk gedoen word.

Gebruik clusteranalise

Met behulp van klusteranalise is dit moontlik om monsters te neem volgens die eienskap wat bestudeer word. Die belangrikste taak is om 'n multidimensionele reeks in homogene groepe te verdeel. As groeperingskriterium word 'n paar korrelasiekoëffisiënt of Euklideaanse afstand tussen voorwerpe deur 'n gegewe parameter gebruik. Die waardes wat die naaste aan mekaar is, word saamgegroepeer.

Alhoewel hierdie soort analises meestal in die ekonomie gebruik word, kan dit ook in biologie (om diere te klassifiseer), sielkunde, medisyne en op baie ander terreine van menslike aktiwiteite gebruik word. Klusteranalise kan toegepas word met behulp van die standaard Excel-gereedskapstel vir hierdie doeleindes.

Gebruiksvoorbeeld

Ons het vyf voorwerpe wat gekenmerk word deur twee bestudeerde parameters - x en y.

  1. Ons pas die Euklidiese afstandsformule toe op hierdie waardes wat bereken word volgens die sjabloon:

    = WORTEL ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Hierdie waarde word bereken tussen elk van die vyf voorwerpe. Die berekeningsresultate word in die afstandmatriks geplaas.
  3. Ons kyk tussen watter waardes die afstand die minste is. In ons voorbeeld is dit objekte 1 en 2. Die afstand tussen hulle is 4.123106, wat minder is as tussen enige ander elemente van hierdie bevolking.
  4. Kombineer hierdie data in 'n groep en vorm 'n nuwe matriks waarin die waardes bestaan 1,2 tree as 'n aparte element op. As ons die matriks saamstel, laat ons die kleinste waardes uit die vorige tabel vir die gekombineerde element. Ons kyk weer, tussen watter elemente die afstand minimaal is. Hierdie tyd is 4 en 5sowel as die voorwerp 5 en groep voorwerpe 1,2. Die afstand is 6,708204.
  5. Ons voeg die gespesifiseerde elemente by die algemene groep. Ons vorm 'n nuwe matriks volgens dieselfde beginsel as die vorige keer. Dit wil sê, ons is op soek na die kleinste waardes. Ons sien dus dat ons datastel in twee groepe verdeel kan word. Die eerste groep bevat die elemente wat die naaste aan mekaar is - 1,2,4,5. In ons tweede geval word slegs een element aangebied - 3. Dit is relatief ver van ander voorwerpe af. Die afstand tussen die trosse is 9.84.

Dit voltooi die prosedure vir die verdeling van die bevolking in groepe.

Soos u kan sien, hoewel dit in 'n algemene analise van 'n groep kan lyk soos 'n ingewikkelde prosedure, is dit moeilik om die nuanses van hierdie metode te verstaan. Die belangrikste ding is om die basiese patroon van groepering te verstaan.

Pin
Send
Share
Send

Kyk na die video: How to run cluster analysis in Excel (Julie 2024).