juillet 26, 2005

Time for some statistical analysis

Publius from Gods of the Copybook Headings has made an interesting observation, if we rank Canadian provinces and territories by the violent crime rate per 100,000 people and we also rank them by the percentage of Aboriginal identity population, then in these two cases the provinces and territories are ranked almost in the same order. In other words, the provinces and territories with a high percentage of Aboriginals also have a high violent crime rate whereas provinces with a low percentage of Aboriginals have a lower violent crime rate.

Publius asked whether somebody could do a more advanced statiscal analysis of these numbers: I take up the challenge. The tool to be used will be the correlation coefficient, which is used to measure to what extent two variables are linked together and move in step. The value of this coefficient is always located in an interval from -1 to 1. A value of -1 or 1 means that these two variables are linked by a perfect linear relationship. In this case, if we know how the variable X varies, then we can exactly deduce how the variable Y will vary. The positive or negative sign indicates whether the variations of these two variables occur in the same direction or in opposite directions. In the case where the correlation coefficient has a value of 0, then this means that there is no linear relationship between these two variables.

If we compute the correlation coefficient between the violent crime rate and the percentage of Aboriginal population among Canadian provinces and territories, then we find a strastospheric correlation coefficient of 0.977. When the correlation coefficient is squared, we get a value called R-square which is the fraction of the variation of the variable Y that can be accounted for by a linear function of variations in the variable X. In this case, the R-square has a value of 0,955. This means that a linear relation can link 95.5 percent of variations among provinces and territories in the violent crime rate to variations in the percentage of the Aboriginal population; factors varying independently of the percentage of Aboriginal population would only account for 4.5 percent of variations in the violent crime rate.

If we repeat the same exercise with the property crime rate, we find that the correlation with the percentage of Aboriginal population is much lower but remains important: the correlation coefficient then has a value of 0.673 and the R-square has a value of 0.453.

If we focus only on the ten Canadian provinces and we compute again the coefficients, we find the following results: the correlation coefficient between the violent crime rate and the percentage of Aboriginal population is 0.920 (R-square: 0.846) whereas the correlation coefficient between the property crime rate and the percentage of Aboriginal population is 0.708 (R-square: 0.501)

These correlations are rather strong. This is not surprising when we know that in 2001 Aboriginals accounted for 3.3 percent of the Canadian population and for 15.5 percent of homicide, sex, robbery and drug offenders in the federal correctional system.

It would be largely beyond the scope of this post to study the cultural, socio-economic, socio-political and historical factors that may or may not explain this situation. However, there is no doubt that this situation is preoccupying.

Publius de Gods of the Copybook Headings a fait une observation intéressante, si on classe les provinces et territoires canadiens selon le taux de crimes avec violence par 100 000 habitants et qu'on les classe aussi selon la proportion de la population ayant une identité autochtone, alors dans les deux cas les provinces et les territoires sont classés approximativement dans le même ordre. Autrement dit, les provinces et territoires avec une forte proportion d'autochtones ont aussi un taux de crimes avec violence élevé alors que les provinces avec une faible proportion d'autochtones ont un plus faible taux de crimes avec violence.

Publius a demandé si quelqu'un pouvait faire une analyse statistique plus poussée de ces chiffres: je rélève le défi. L'outil utilisé sera le coefficient de corrélation, qui sert à déterminer jusqu'à quel point deux variables sont liées entre elles et varient de concert. La valeur de ce coefficient se situe toujours dans un intervalle allant de -1 à 1. Une valeur de -1 ou 1 signifie que les deux variables sont liées par une relation linéaire parfaite. Dans ce cas, si on connaît les variations que subit la variable X, alors on peut déduire exactement les variations que connaît la variable Y. Le signe positif ou négatif indique si les variations des deux variables ont lieu dans le même sens ou dans des sens opposés. Dans le cas où le coefficient de corrélation a une valeur de 0, alors cela signifie qu'il n'y a aucune relation linéaire entre ces deux variables.

Si on calcule le coefficient de corrélation entre le taux de crimes avec violence et le pourcentage de la population autochtone dans les provinces et territoires canadiens, alors on trouve un coefficient de corrélation stratosphérique de 0,977. Lorsqu'on met le coefficient de corrélation au carré, on trouve une valeur appelée R-carré qui est la fraction de la variation de la variable Y qui peut être expliquée par une fonction linéaire de la variation de la variable X. Dans ce cas-ci, le R-carré vaut 0,955. Cela signifie qu'une relation linéaire permet de lier 95,5% des variations entre les provinces et les territoires dans le taux de crimes avec violence aux variations dans la proportion de la population autochtone; les facteurs variant indépendamment de la proportion de la population autochtone n'expliqueraient que 4,5% des variations dans le taux de crimes avec violence.

Si on répète le même exercice avec le taux de crimes contre la propriété, on trouve que la corrélation avec la proportion de la population autochtone est bien plus faible mais reste importante: le coefficient de corrélation est alors de 0,673 et le R-carré vaut 0,453.

Si on se concentre seulement sur les dix provinces canadiennes et qu'on calcule de nouveau les coefficients de nouveau, alors on trouve les résultats suivants: le coefficient de corrélation entre le taux de crimes avec violence et la proportion de la population autochtone est de 0,920 (R-carré: 0,846) alors que le coefficient de corrélation entre le taux de crimes contre la propriété et la proportion de la population autochtone est de 0,708 (R-carré: 0,501)

Ces corrélations sont plutôt fortes. Ce n'est pas surprenant lorsqu'on sait qu'en 2001 les Autochtones comptaient pour 3,3% de la population canadienne et pour 15,5% des délinquants condamnés pour un homicide, une infraction sexuelle, un vol qualifié ou une infraction liée à la drogue dans le système correctionnel fédéral.

D'étudier les divers facteurs culturels, socio-économiques, socio-politiques et historiques qui expliquent ou non cette situation déborderait largement du cadre de ce billet. Cependant, il ne fait aucun doute que cette situation est préoccupante.


Publié par Laurent à juillet 26, 2005 08:49 PM
Commentaires

Congratulations for the objectivity and non-biased content of your fact reporting.

The elements you point out are known, and take note notably that the Strategic Plan 2005-2007 of Quebec's ministry of Health and Social services (MSSSS) includes specific orientations for dealing with the problems of Natives. The Kree (Eeyou) and Inuit are especially vulnerable to these problems.

These issues are complex and span the range of poverty, lack of housing (forcing abusive families to live together), unemployment, suicide, toxicomany, and perverse effects of Native-specific laws (i.e. generating ghettos and promoting welfare dependency over entrepreneurship).

The problems you mention are genuine and known to the government - but caution is needed before blaming culture or genetics, the usual suspects.

Écrit par: Richard Broenck à juillet 27, 2005 10:56 AM

Add to Technorati Favorites Top Blogues Politics Blogs - Blog Top Sites